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REACTIFS ET METHODES POUR LA DETECTION DE GENES LIES AU COMPLEXF MAJEUR 
D'HISTOCOMPATIBILITE D'OISEAUX D'ELEVAGE, TELS QUE LE POULET OUMPLEXE MAJEUR 

(§) L'invention vise des molecules d'acides nucleiques 
permettant de detecterceux des genes du GMH impliques 
dans les phenomenes de resistance ou de susceptibilite au 
developpement de tumeurs viro-induites. Les amorces ela- 
borees a partir de ces molecules sont utilisables dans une 
rnethode de genotypage d'oiseaux d'eievage et notamment 
du poulet, caracterisee en cequ'elie comprend 

- ('amplification d'un echantiilon d'acide nucleique prove- 
nant de I'animal a etudier a i'aide d'un ou de plusieurs cou- 
ples d'amorces capables de s'hybrider specifiquernent avec 
I'acide nucleique d'une region polymorphe des systemes 
Rfp-Y ou B du CMH desdits oiseaux, et 

- la detection des produits de PCR obtenus. 
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REACTIFS ET METHODES POUR LA DETECTION DE GENES 
LIES AU COMPLEX MA JElJR D ' HISTOCOMPATIBILITE D ' OISEAUX 
D-ELEVAGE, TELS QUE LE POULET 



L ' inVenti ° n a P° ur ob ^t la detection de genes 
au complete majeur d ' histocompatibility (CMH) 
d '° iSeaUX d '^vage, tela que le poulet. A ce titre elle 
concerne des molecules decides nucleiques permettant de 
detects ceux des genes du CMH implies dans les 
phenoraenes de resistanro ~ 

resistance ou de susceptibili te au 

deVel ° PPement dS fc — viro- induites . L' invention 
concerne egalement les applications de ces molecules 
dacxdes nucleiques, notamment pour le development de 
tests de genotypage chez les oiseaux d'elevage, en 

particulier le poulet, et pour la. selection d'animaux 

a mteret . 



Les maladies virales infectieuses sont 
redoutees des eleveurs en raiqnr ^ i 

' en raison de leur caractere 

contagieux qui conHi i •; r ^ 

j i . 4 conduit a des pertes importantes 

d 1 animaux . 



3 VaCCination - constitue une prophylaxie 

" C 7 •": ; r: '" "' : ^ r - d * hW.rvlrul.ntea, 

rendant necessaire l . identification des naplotypes 

resistants. yy 

_ , Diveraes methodes ont ainsi ete proposees pour 

tenter de selectionner ceux des animaux qui sont capables 
de reszster a de telles pathologies et ceux qui sont au 
contra lre susceptible*. d -Stre affectes." 

Les techniques les plus utilisees en routine 
sont basees sur des polymorphic serologies ou de 
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type RFLP. Toutefois, ces methodes ne fournissent pas de 
connaissances precises sur le phenomene de resistance ou 
de susceptibilite a la maladie, en particular par manque 
de caractere discriminant vis-a-vis des genes des 
systemes B ou Rfp-Y du CMH. 

Les travaux des inventeurs sur le sequencage de 
genes du CMH a montre la complexity genetique de cette 
regaon, ce qui les a conduits a prendre ■ en compte un 
autre type de polymorph! sine, a savoir base sur la 
sequence de ces genes et des regions apparentees, telles 
que celles de leurs promoteurs et des regions 
microsatellitaires. Les inventeurs ont ainsi mis au point 
des moyens pour disposer de molecules oligonucleotides 
hautement specif iques des polymorphismes observes 
permettantd- identifier les parties de genes, et meme les 
sites impliques dans le controle de la resistance ou de 
la susceptibilite au developpement de tumeurs. 

Le caractere specifique de ces molecules, vis- 
a-vis d'un gene donne de 1 • un des systemes du CMH, en 
fait des outils discriminants particulierement fiables 
pour identifier avec precision la capacite de resistance 
ou de susceptibilite du poulet etudie, ou d'autres 
oiseaux, a une infection virale, et pour etudier au 
niveau moleculaire les sequences du CMH impliquees . 

L' invention a done pour but de fournir des 
molecules d'acides nucleiques permettant de detecter 
specif iquement, chez i es oiseaux d'elevage et en 
particulier chez i e poulet, les genes lies au CMH 
impliques dans les phenomenes de resistance ou de 
susceptibilite au developpement de tumeurs viro-induites . 
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Elle vise egalement a fournir une methode et un 
kit de detection de genotypes de mise en oeuvre aisee en 
routine. 



Les molecules d'acides nucleiques de 
1 ' invention sont caracterisees en ce qu'il s'agit de 
molecules, isolees de leur environnement naturel, 
d'acides nucleiques de genes codant pour des proteines 
impliquees dans le controle de la resistance ou de la 
susceptibilite au developpement de tumeurs viro-induites 
chez les oiseaux d'elevage, telles que eelles de la 
maladie de Marek chez le poulet, avec le cas echeant, les 
regions qui leur sont attachees, telles que celles du 
promoteur ou microsatellitaires . Le terme gene tel 
qu 'utilise dans la description et les revendications 
englobe ces regions . 

Ges molecules d'acides nucleiques sont plus 
specialement caracterisees en ce qu'elles presentent les 
sequences d'acides nucleiques de genes du systeme B ou du 
systeme Rfp-Y du CMH des oiseaux d'elevage, a 1' exception 
des sequences des genes de classe II B-L, du gene 17.5, 
du gene 12.3 et du gene B-FTV de classe I, ou sont 
capables de s ' apparier avec l' un des brins d ' un gene 
capable de coder pour une proteine telle que definie ci- 
dessus dans des conditions faibleraent stringentes. 

L'appariement dans des conditions de faible 
stringence auquel il est fait reference ci-dessus est 
realise a temperature ambiante, dans un milieu 0,1 SSC, 
avec lavage a temperature ambiante . 
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Les genes de classe II B-L sent " deer its dans 
Immunogenetics 31:179-187, 1990 et Eur. J" . Immunol, 1993, 
23:1139-1145. 

Le gene 17.5 appartient a la superf amille des 
genes codant pour les le.ctines et le gene 12.3 a la 
famille des genes codant pour des proteines liant la 
guanine (guanine nucleotide-binding protein) . Ce gene est 
decrit dans Immunogenetics 39:221-229, 1994. 

Le gene 12.3 est decrit dans P.N. A. S. USA, vol. 
86, 4594-4598, j uin 1989/ Genetics. 

Le gene B-FIV de classe I est decrit ..dans 
Immunogenetics 31:405-409, 1990. 

L 1 invention vise notamment les molecules 
d'acides nucleiques repondant a ceux des enchainements de 
1 1 un des genes suivants : 

. enchainement du systeme Rfp-Y 

B-FV (figure 1) , B-F VI (figure 2) ; 
. enchainement du systeme B, 

8.4 genomique (figure 3) ; B-F I (figure 4) ; 
C12.1 (figure 5) ; DM (figure 6) ; TAP1 (du debut de 
I'exon 2 a I'extremite 3') (figure 7) ; et TAP2G (figure 
8) . 

L' etude des sequences decides nucleiques des 
molecules definies plus haut a permis de reperer avec 
precision les blocs de polymorphismes qui doivent etre 
detectes pour etablir un genotypage fiableet precis. 
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En comparant les sequences de ces blocs, 
provenant de differents genes d'un meme haplotype ou d'un 
meme gene de differents haplotypes, les inventeurs ont 
pris en consideration les enchalnements divergents et 
elabore, pour chague gene, des oligonucleotides 
complementaires de ces enchainements divergents. 

On dispose ainsi d f amorces specif iques et 
discriminantes vis-a-vis d'un gene donne du systeme B ou 
du systeme Rfp-Y. 

■ L » invention vise tout specialement les 
molecules d ' oligonucleotides correspondant a ces 
enchalnements et c.omprenant une partie de la region 
polporphe des syst ernes du CMH du poulet ou autoes 
oiseaux d ' elevage . 

On rappelle que la region polymorphe peut etre 
dans le gene ou dans une region apparentee telle que les 
regions microsatellitaires ou celle du promoteur. 

,i ■ 

Selon un mode de realisation de 1' invention, 
les ■ polymorphismes sont lies a la f onction des systemes 
du CMH , 

II s'agit ainsi avantageusement de molecules 
correspondant a une partie d'un exon. On citera a titre 
d r exemple des molecules correspondant a l'exon 2 (domaine 
a 1) des genes Y-F du poulet. Un couple d' amorces 
approprie est constitue par : 



Y-F VI a 1 : GGC C C CGGGATGC CGGGGTT C 
Y-F VI a 1, R : ATCCGCTCACCGCCCTGG 
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Selon un autre mode de realisation de 
1 '.invention, les molecules oligonucleotidiques 

correspondent a une partie d'une region polymorphe qui 
n'est pas liee a la fonction des systemes du CMH. Des 
regions preferees de ce type sont des microsatellites . 

En considerant par exemple, le gene B-FI, des 
molecules d ' oligonucleotides utilisables pour constituer 
des couples d' amorces correspondent aux enchalnements 
suivants : 

B-FI : 5' CCA GCA GTC ACT GCA CAT AT 3' 
B-FI', R : 5' AGG TGG AGT GCG CAA AGT T 3'. 

Avec les molecules oligonucleotidiques definies 
ci-dessus et celles elaborees a partir de genes connus, 
mais selon la demarche de 1 • invention, on dispose de jeux 
d' amorces hautement specifiques, permettant de determiner 
avec precision 1 ' haplotype de 1' animal a etudier et de 
detecter s'il est resistant au developpement de tumeurs 
viro-induites, ou au contraire susceptible d'etre 
affecte. I 



L' invention vise done egalement une methode de 
genotypage d'oiseaux d'elevage et notamment du poulet. 

Cette methode est caracterisee en ce qu • elle 

comprend 

- 1 'amplification d'un echantillon d'acide 
nucleique provenant de 1 • animal a etudier a 1 ' aide d'un 
ou de plusieurs couples d- amorces capables de s'hybrider 
specif iquement avec 1 ' acide nucleique d'une region 
polymorphe des systemes Rfp-Y ou B du CMH desdits 
oiseaux, 
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et 



la detection des produits de PCR obtenus . 
Une simple comparaison des resultats obtenus 
avec un referentiel etabli au prealable permet de 
determiner rapidement 1 'haplotype de 1< animal. 

L'echantillon d'acide nucleique est constitue 
en particulier par de 1 -ADN genomique extrait de materiel 
biologique de 1 -animal a etudier ou par ce materiel meme , 
en particulier par du sang de 1' animal. II peut s'agir en 
variante d'ADNc, d ' ARN ou encore de PNA (polypeptides 
nucleic acids) . 



Les amorces sont elaborees a partir des 
molecules ol igonucleotidiques definies ci-dessus et, 
d'une maniere general e, de tout gene (et region 
apparentee) codant pour une proteine impliquee dans le 
controls de la resistance ou de la susceptibilite aux 
tumeurs viro-induites chez les oiseaux d'eievage et 
notamment de poulet, en particulier les genes B-L de 
classe II, 17.5, 12.3 et B-FIV de classe I. 

II s'agit par exemple d- amorces de regions 
microsatellitaires permet tant de detecter des haplotypes 
du complexe B, telles que ceiles elaborees a partir du 
gene B-FI, et evoquees ci-dessus, ou d' amorces permet tant 
de detecter des haplotypes du systeme RFp-Y, et elaborees 
a partir du gene 17.5, comme le couple : 

17 . 52 : CAG GAT CTG CAC TGG CCA ATA 

17.5, Rl : GAA TGG CGG TGC TTC CGT GCC TGG 

La detection des produits de PCR est effectuee 
selon les techniques classiques. Ces techniques 
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comprennent le sequencage, l'electrophorese, les 
hybridations avec analyse SSOP ou SSCP. 

Cette technique sera avantageusement choisie 
selon la nature du polymorphisme implique . Ainsi, dans le 
cas de polymorphisme de type microsatellite , on detectera 
avec avantage les produits de PCR selon leur taille en 
ayant recours aux techniques d 1 electrophorese . 

Lorsque le polymorphisme ne concerne que 
quelques nucleotides, voire un seul nucleotide, on aura 
plus specialement recours, aux fins de dif ferenciation 
des haplotypes de produits de PCR, aux techniques 
d' hybridation (analyse sur membrane a 1 ' aide de sondes 
specif iques des sequences d ' haplotypes , SSOP ou Sequence 
Specific Oligonucleotide Probe), de migration 
differentielle des echantillons denatures (SSCP ou Single 
Strand Conformational Polymorphism) , ou de sequengage . De 
maniere generale, cette derniere technique est pref eree 
compte tenu de la simplicite de sa realisation. 

L ' invention fournit ainsi une technique simple 
et rapide d' etablissement du profil genetique d'un grand 
nombre d'animaux a etudier, ce qui permet de determiner 
les haplotypes et de selectionner ceux d'interet en vue 
d'un elevage . 

De plus, chaque type de gene pouvant etre 
discrimine en utilisant des amorces presentant la 
specificite requise et son appartenance au systeme B ou 
Rfp-Y pouvant etre etablie, il est possible d'effectuer 
des etudes f ondamentales plus completes. 
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L 1 invention vise egalement un coffret ou 
trousse pour detecter le genotype du poulet ou autre 
oiseau d'elevage selon la methode definie ci-dessus. 



Ces cof frets ou trousses sont caracterises en 
ce qu'ils comportent les reactifs necessaires pour la 
realisation d'au moins une PCR et du test de revelation. 

En parti culler, ils comportent les amorces pour 
la PCR, un temoin positif de la reaction, ainsi qu'une 
notice d 'utilisation . 



Les amorces se presontent sous forme 
lyophilisee ou en solution ou, selon le mode de 
detection, sur un support. Le support peut etre, de 
maniere classique, une plaque multipuits ou se presenter 
sous forme de puces a ADN. 

D'autres caracteristiques et avantages de 
1' invention sont exposes dans les exemples qui suivent , 
dans lesquels il est fait reference a la figure 9 
representant une photo d • electrophorese de produits de 
PCR illustrant le test de genotypage de 1« invention. On 
rappelle que les figures 1 a 8, deja evoquees ci-dessus, 
illustrent les sequences de genes selon 1 ' invention . 

Exemple : 

Etude d 1 haplotypes Rfp-Y du poulet a 1 ■ aide 
d ' amorces microsatellitaires . 



- amplification avec le Kit Expand™ High 
Fidelity PCR System 
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.Avec les amorces 17.5 Rl/ 17.52 

ADN genomique : i xxg 
Oligos prendre : 0,3 xiM 
dNTP : 8 Ml 

qsp H 2 0 50 /xl 

On ajoute 50 xil de Mix 2 en melangeant. 

Mix_2 : 0,75 /xl d ' enzyme 

10 /xl TP10X avec MgCl 2 
qsp H 2 0 5 0 /xl 

Programme d ' amplification : 

30 Cycles 

94°C 94°C 65°C 72°C 4°C 
2' 30' ' 1' !• 



• Avec B-FI/B-FI, R : 

ADN genomique : l /xg 
Oligos prendre • 0,3 /xM 
dNTP : 8 /xl 
qsp H,,0 5 0 /xl 

etaj outer 50 /xl de Mix 2 en melangeant . 

Programme d ' amplification : 

3 0 Cycles 

94°C 94°C 60°C 72°C 4<>C 
2 • 30 ' ' i ■ ! . 



4 
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- revelation par electrophorese sur gel 
d* agarose ou par sequengage . 

Le test a ete applique a 9 haplotypes de 

poulet. selections serologiquement pour le complexe B 

II s'agxt des haplotypes B4, B5 , B7, B12, B13 , B14, B15 
B21 et d'un haplotype inconnu BX. 

Plusieurs individus d'un meme type ont ete 
etudies pour B12 (6 individus), B13 (3 individus) B14 (4 
individus), B21 (4 indivxdus) et un seul individu pour 
les autres haplotypes. 

La figure 9 donne une photo d- electrophorese 
sur gel d-agarose a 1 % des produits de PGR obtenus a 
1' issue de l'etape d ' amplification . 

Les pistes 1 et 27 correspondent aux marqueurs 
de taille et les pistes (2 a 25) aux produits de PGR des 
haplotypes suivants : piste - 2 : B4 ; pi ste 4 : B5 • piste 
5 : B7 ; pistes 6a 11 : B 12 ; pistes 12, 13, 14 : B13 • 
Pistes 15, 16, 17 , 18 : B14 . piste 19 ; fii5 ; pistes | 

21, 23, 24 ; B21 ; pi ste 25 : B X (absence de detection 
pour les pistes 3 et 22) . 

L'examen de cette figure montre que les 
xndrvidus qui ont 1 -haplotype B12 donnent une meme bande 
et sont done bien homogenes. La meme observation 
a -applique aux individus B14 . En revanche, avec B2l on 
constate que les profils sont d i ff £ rents , ce qui d(§montre 

l'xnefficacite de 1 - approche serologique. Compte-tenu de 

la position de la band^ H*=> dy - . 

^ anae ae BX * on determine qu'il s'agit 

d'un haplotype B4 . 
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L' application pratique de cette methode revient 
a soumettre les individus naturellement resistants au 
protocole decrit ci-dessus en prenant en compte les deux 
systemes Rfp-Y et B du CMH et a ne selectionner parmi des 
animaux a tester que ceux dont le profil correspond a 
celui des animaux resistants. 

L ' invention fournit ainsi les moyens de 
verifier 1 • homogeneite des animaux et d'effectuer des 
selections rigoureuses en prenant en compte chaque 
systeme du CMH, et dans ces systemes les genes 
recherches . 
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REVINDICATIONS 

1/ Molecules d'acides nucleiques isolees de 
leur environnement naturel, de genes codant pour des 
proteines impliquees dans le controle de la resistance ou 
de la susceptibilite au developpemenfc de tumeurs chez le 
poulet, telles que celles de la maladie de Marek, et de 
regions apparentees auxdits genes caracterisees en ce 
qu'elles presentent les sequences d'acides nucleiques de 
gSnes du systeme B ou du systeme Rfp- Y, correspondant au 
complete majeur d ' histocompatibilite des oiseaux 
d'elevage a I 'exception des sequences des genes de classe 
II B-L, du gene 17.5, du gene 12 . 3 et du gene B-FIV de 
classe I, ou sont capables de s'apparier avec l'un, des 
brins d'un gene capable de coder pour une proteins telle 
que definie ci-dessus dans des conditions faiblement 
stringentes. 

2/ Molecules d'acides nucleiques selon la 
revendication 1, caracterisees en ce qu'elles repondent a 
l'un des enchaxnements suivants • 

i * ■ 

. enchainement du systeme Rfp-Y 

B-FV (figure 1), B-FVI (figure 2) ; 
. enchainement du systeme B, 

8.4 genomique (figure 3) ; B-FI (figure 4) ; 
C121 (figure 5), DM (figure 6), TAP1 (du debut de 1 ' exon 
2 a 1'extremite 3') (figure 7), et TAP2G (figure 8). 

3/ Molecules d'acides nucleiques selon la 
revendication 1 ou 2, caracterisees en ce qu'elles 
correspondent a une partie des sequences definies dans 
les revendications 1 ou 2 , cette partie etant specif ique 
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et discriminate pour un gene donne des systemes B et 
Rfp-Y. 

4/ Molecules d'acides nucleiques selon la 
revendication 3, caracterisees en ce qu'il s'agit de 
molecules d ' oligonucleotides correspondant a une partie 
de region polymorphe des systemes du complexe majeur 
d ? histocompatibility du poulet. 

5/ Molecules d'acides nucleiques selon la 
revendication 4, caracterisees en ce qu'il s'agit de 
molecules d • oligonucleotides correspondant k une partie 
d'exon. 

6/ Molecules d'acides nucleiques selon la 
revendication 4, caracterisees en ce qu'il s'.agit de 
molecules d- oligonucleotides correspondant a une partie 
de region polymorphe qui n'est pas liee a la fonction des 
systemes du CMH, telle' que les regions 

microsatellitaires .. 

7/ Methode de genotypage d'oiseaux d'elevage et 
notamment du poulet, caracterisee en ce qu'elle comprend 

- 1 ' amplification d'un echantillon d'acide 
nucleique provenant de 1 - animal a etudier a 1 • aide d 'un 
ou de plusieurs couples d 1 amorces capables de s'hybrider 
specif iquement avec l'acide nucleique d'une region 
polymorphe des systemes Rfp-Y ou B du CMH desdits 
oiseaux, 

et 

- la detection des produits de PCR obtenus . 
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8/ Methode selon la revendication 7 
caract6ria.ee en ce que les amorces sent elaborees a 
partir des molecules selon l-une quelconque des 
revendications 3 a 6, et de tout gene (et region 
apparentee) codant pour une proteine impliquee dans l e 
controle de la resistance ou de la susceptibilite aux 
tumeurs viro-induites chez les oiseaux d'elevage et 
notamment de poulet, particulierement les genes de classe 
II B-L, 17.5, 12.3 et B-FIV. 

9/ Methode selon la revendication 7 ou 8, 
caracterisee en ce que la detection des produits.de PCR 
est effectuee par sequencage. 

10/ Cof f ret ou trousse pour le genotypage 
d'oiseaux d-elevages et notaimnent du poulet, caracterise 
en ce qu'ils comportent les react if s necessaires pour la 
realisation d ' au moins une PCR et du test de revelation, 
selon la methode de la revendication 8 ou 9, en 
particulier les amorces elaborees a partir des molecules 
d'acides nucleiques selon 1-une quelconque des 
revendications 3 a 6. 
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B-F V 

GGC CCC GGG ATG CCG CGG TTC GTG ATC GTC GGG TAG GTG GAC GAG AAA ATC TTC GGT 
ACC TAC AAC ACT AAG AGO AGG ACT GCA CAG CCT ATC GTG GAG ATG CTG CCG CAG GAG 
GAC CAG GAG CAC TGG GAC ACG CAG ACC CAG AAG GCG CAG GGC GGT GAG CGG GAT TTT 
GAC TGG AAC CTG AAC AGG CTG CCG GAA CGC TAC AAC AAA AGT AAA GGT GAG CGT GGG 
GGA AGC TGC AGC GCG ATG CGT CTG GGA CAG GAG CTC TGT GTG CCG AGG GTG TCC GCC 
AGC CCC ACT GAG GTG TGG CCG TGC CCC ACG CCC AGC TGT GCT GGG CCG TCC ATG TGT 
G«T GGC ACT GTC CCT GGG CCG CCC TGC TCC TGC GCC CAC CCA CCC CAC CCC AGC CTC 
ATG GCA CTC GCG GTG CCC CAC AGC CCT AGA AGC CTC TCA CCT ATT ACT CTG GCT GTC 
CCT CAG GGT CTC ACA CGA TGC AGA TGA TGT TTG GCT GTG ACA TCC TGG AGG ACG GCA 
GCA TCC GAG GGT ACG ATC AGT ATG CAT TTG ATG GGA GGG ACT TCC TTG CCT TTG ATA 

T£ ^ GGA TGA CGT TCA CCG CGG CGG ATC CAG TGG CTG AAA TCA CCA AGA GGA GAT 
GGG AGA CAG AAG GGA CGT ATG CTG AGA GAT GGA AGC ATG AGC TGG GGA CTG TCT GTG 

!J G AGA ACT TGA GGA GAT ACC TGG AGC ATG GGA AGG CAG CGC TGA AAA GGA GAG GTG 
AGG ATG GGA GGG GGA CGT GGG GCT GGG CTG GGT GTG GGG CAG AGG CTC AGT GTG GGG 
rrr ^ ^ ^ ACA ACG TCA CCC ^ TGC AGT GCA GCC CGA GGT GCG AGT GTG 

GGG GAA GGA GGC CGA TGG GAT CCT GAC CTT GTC CTG CCA CGC TCA CGG CTT CTA CCC 
GCG GCC CAT CAC CAT CAG CTG GAT GAA GGA CGG CAT GGT CCG GGA CCA GGA GAC CCG 
CTG GGG GGG CAT CGT GCC CAA CAG CGA TGG CAC CTA CCA CGC CTC GGC TGC CAT TGA 
TGT GCT GCC GGA GGA TGG GGA CAA GTA TTG GTG CCG CGT GGA GCA CGC CAG CCT GCC 
CCA GCC TGG TCT CTT CTC ATG GGG TGA GCT GGC AGC GTG GGG CAC GTG GGG TTG GGA 
TTC GCA GGC TGC CCC TTC CTT TAC TGA CAA CGG CGC TCT CCT CCA f'-AG CCG C^G CCC 
CTC GTT gS ^ ^ ^ ^ ^ GCG GTC GTT GCC ATC CTG GCT GTC ATC GCT GCG 



B-FVT 
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S Sc G AGT AAG S £ £? ™ £ S £ ^ ™ ™ ™ ^ 

^ TGG S? ^ CTG S SS S2 ^ ^ ^ ^ ^ ^ ^ ™ ™ 

GGA AGC TGC Ag2 GCG aS Sg G Ta CAG ™ J£* ^ GGT GAG TGT GGG 

AGC CCC ACT GAG GTG TGG Ccl He CCC ACG r^r £r Irl ^ CCG AGG GTG TCC GCC 
GGT GGC ACT GTC TCT GGG CTG CCC TGC i C C TGC G^C r Jr SI ^ CCG TC ° ATG TGT 
ATG GCA CTC GCG GTG CCC CAC AGC CCA IS IS S° A ° CCA CCC CAC CCC AGC CTC 
CCT CAG GGT CTC ACA cS Sc AGA SJ rrn £S ^ ATC ACT CTG ACT «TG 

GCA TCC GAG GGT AcS ATC AGT ATG cS IS SI ^ ^ TCC TGG AGG ACG GCA 

TGG ACA CGA TGA CGT TCA CCC err rrr I GGA GGG ACT TCC TTG CCT TTG ATA 

GGG AGA CAG AAG gS cS Sg Sg AGA S S> TGG CAG ^ TCA CCA AGA GGA GAT 
TTC AGA ACT TGA GGA GaI aIc Sg Acr S* AG ° ATG AGG TGG GG * CTG TCT GCG 

AGA ATG GGA GGG AgJ CGT GGG IS S J S£ GCG rS ^ GAG GTG 

TGC TCA GCC CGG CCC ACA AC*V TGA Arr ^ SI GGG CAG GGG CTC AGT GTG GGG 

GGG GAA GGA GGC CGA GAT cS GAC cS CTC cS cS cSc S£ GG ^ GC ° AGT GTG 

GCG GCG CAT CGC CAT CAG CTG cat rsa SI XTS CGC TCA CGG CTT CTA CCC 

CTG GGG GGG CAT CGT GCC cS vZ GGA TCC rS ■ SI ° CA GGA CCA GGA GAC CCG 

TGT GCT GCC GGA GGA TAG Get C^A tS ^ TTA CCA CAC TTC GGC TGC CAT TGA 

CCA GCC TGG CCT CTT Sc TTG tIa rrr f G CCG C ° T GGA GCA CGC ^AG CCT GCC 

ATT TGG GGG CCG CCC CTT 7gT TtI CTC Sa IS ^ ^ GGG ATG TGT GGA GTT GGG 
CAA CCT GAT CCC CAT TCA GGC II? cS rS rS r™ ^ ^ CCC AGA GCC CCA GCC 
TTT GAT TGC AW * ^ C ° F CCC CTT GGT GGT TCT CTT CGT TGC 
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CCQ GGT TC? err Arr rP^J GGC TGT ° TT TAG GTC GGC CTG TGG GGA AAG 
■ rrrrrrJrrrr?^ CAT GTC CCC TCT TCC AAC ACT GTT CCT GAA TGA GtT 

rrr S ^ ? S 2° A GGG GGT GGG GCC ACA GCG GAG CCG AAA GCG AAA GGA 

^CCCCr^r^^ GGG GCT GCG GCT GCT GCT GGC GGG TG A GAG^ CCG 
ACC CCC CCC GGC CCC CTC ATG TCC CAC CAC CCA T^T CGC CCC rrr rrrrrr 

LtL LAI LiC Li 1 T AC TTC CCA CAA TGC TCC CAT CCC CCC cat a at r-T,- 
AG A GTC CCC CAA ACC CCC ATG ACC CCC CCC ACG ^CCCC^^rrrAT^Ar 
CCT CTC ACG TCC CCC ACT GTC CCC AAG ATT 7 CCC ^ ^CCT atc r^r 
ATT ATC CCC AAA ATG TCC CCC AAT GTT CCC ATC ACC CCA Afr^rr a^ 
TCC CTA TCG CTC CTC AAT GTC GCT ATH ATr rrr att ^ , C CCA AGG 

CCA TTA CT^ TCC ^ A ™ ^ aJc S C A C T I ^ ^ AGATCC 
I TA CCC CCA ATA TCC TCA TTA CAC CCC AAA TGT CCC CAA TC,T rrrrTr 

TOT So CA C ? T ,A ?r^ CCC CAT TA ° CCC CAA TAG CTC CCA a\ C Vct CCC^AG 

I GT CCC CAI T.AA CCC CAA AAT GAC Cfr ATT Apr rrr rAr * ~Z -i.-i ZT ^ 

CCC ATG CCC TCA GAC CCC TTC AK ^CCT CTC 

CCC TGG GGG ACT CTA GCC CCA CTC GGG TCC CCC CCC 'GGA CTC Sc^ca ^ 
CTC TOC C A T CC CC C G C Ic^^c^ 

\l *-CC C 1 C C TC TGC A IG TGT CCC AAT GTC TCC ATA r at rrr at a at-V 

GTC rrr Irr rrrlrJ £ CA AG1 GTC CCT GTG TCC GTG CAG TTT CTC CCT 

StG TCC cS GTG T C C C C %l T^T ° T «™ C^c^c^ 

X-o ™ TCC CTA TGT TCC CCT GGT GTT TCC ATG TCC rrr pat rrr 

CTC CC? A^C ?S rrJ ?I? CCC ATA TCC CCC AGT ^™ ATG TCC CTT CAC 
CmC^TC^ 

^ ! ^ LL 1 iC GCT GCC CCC CCA TCC TCC TTT GTC rrr tat Trr- nn-r 

GCC CGC KC CCC% G G G C T ^C G r G A G c G c^ G ° TC ^^"A^A^Kx 
gS GGG GAC SSSSS ACA CGG 
GGG GAT GAG GGC ACC TAC AT : W TOT (TO T^Sj-^^^ rI^ A 5°° 

t C g\ G t A c C c A t?t G gS^ 

CTA TGG GGC TGT AGG GTG GAT GGG ACT GGG TGA TAT TCC TGT GGG GGC TGT 



ACC GGG TOO WW^G^^h ^ TAT GGG 
CTT CAC CTG TAG GTT TAT AGG^ GGG Gel TC ? rlr 25° TG ° CAT CAT CCC ATA 
ATA TGG ACC GAT GTC CCC CCA CAT r^r-rnP^ CTA TAC AGC GTA TGG GCT 
GTC CCC GAA GAA CCTGCT GGT GAC GCT 

CCA GTC TGG CTT CTA CCC CTT GGATCT CAC <^ n A ° C AGA GCT ACG CTG 
CGG GGG CTC GGG GAC ATC ACA GT C ^CCAG^aPa^I^ GC ° CCG CGC 
GAC TTC AGG TCA CCG CCA GGCAGcrcArrn ??£ Z£ C AGT GAT GGA CAG CTG 
AGC ACG GCT GAT CCC CGC ACG CCC CCA Ir?^^ CA ° CCG GAC GGC GGC 
CGT TGT CAC CCA CAC TGC ACT GGC Ca a frr Fat^ CG ° ° GA CAT CTA CAG G TG 
GCT CCT GGC TGG TGA GGG GGG Trr CTC C ° T CCG ACT 

TTG GGA TGC TGG GAC CAT GGT TAG GAG GCT CTT Jrr ^ CAC ° TG GAG ^ 
GCC TGG GAC AAT GGG AGA TCA TGC att rrr AG ° GAG ATC AGG ACC A ^G 
GGT GAC ACT GTG mAGGGttmm rwfJ? ^ ° AC CCC ACC CAG GAT 
CAC CTG GAG GAC ATC ACG GGg Jtc TTC 2£ ^ GGG ACC GAG GGA CCG 
CTC ATC CGT TGG CTC 'TAG CCT cVrrfr?^ GCC 777 GTC CTC TGT GGC 
CCC CCA CAT CCT CAC ACC cS AT^ Wc£a^J% TCC CAC ATC CCA GTG 
ATG TCA CTA TGT CCC AAT ATC CTA Irr ^ 1°° CCC ATG TCC CCA TGA GC A 

AGT GGG AGC AGT GGG A GG AA G TCC TTr rrr 1°° 000 CAA ACT GGG AGC 
CTG GGG AC A TCT GGG TGC 'CAT CCC Tr? ° CA ° AT ° AG TGG CAC 
GCC TTG GGT GAC ATT GGG ATC CTC Ilolcl CTG CAG ^ ^ TGC ATT 
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GT CGACGGGATCTGGATAGGT CGT CAGT CAT CCTAATTAAGGAGGGACAACAGTGAATGGG 
GAGGAGCCGATGACTCAGGCTGGGAGTGGTGATCCCAGAGGTTTCCTCTGCTGTCAGTGAC 

TCCGTGCTTTCGCTTTCGCTTCACAACCTC ■ -GGAGCG CATT CTG CCTGGCGCCCGATGAC 

GTCACATAAACCCCCGACTGCCATTGGCGGAGAGGCGACGGAGGAGCCAATGGGGGCGCGG 
GGCGGGGCG GAG GAG TAG G AAAAG CT G AAG G A CGTGCGCTGGGTGCGGCG G A CT T GAG AG T 
G GAG CGGTGTGAGG CGATGGGG CCGTG CGGGG CG CTGGG CCTGGGG CTG CTG CT CG C CG CC 
GTGTG CGGGGCGGCGG CCGGTGAGTG CGG CCGGACCGGGACCCCT CCCCGCC T GTAACCCC 

ACCCCGGGCTGTGCCCGTGGGATCCTCAGACCCCCACCCGCGGCTQVCGGCCTCGCTGCCG 
T CCGCCCCCGCAGAG CTCCATT CCCTGCGGTACGTCCATACGG CGATGACG GAT CCCGGCC 

CCGGGCTGCCGTGGTTCGTGGACGTGGGGTACGTGGACGGGGAACTCTTCGTGCACTACAA 
CAGC^CCGCGCGGAGGTACGTGCCCCGCACCGAGTGGATGGCGGCCAACACGGACCAGCAG 
TA CTGGGAT GGA CAG A CG CAGAT CGGACAGGGCAATGAGCGGAGTGTGGAAGTGAGCTTGA 
ACACACTG CAGGAACGATACAACCAGACCGG CGGTGAG CACGG CCGGGG CCG CGG CT CCG^ 
GGGTGTGGGATGGGCTCCATGGCGCAGTGCCGCCCACACCCCCCAGGCCTGGCCCTGCCCG 
GCGGCACCGTCGCGGGGCTGCCCGTCACAGCCCCACCGCGCTCGGGGTGCCGCGTCCCGGG 
GGGACCCCAAeCCArcCCCGCTGCAGTGGGAGCCCGGAGCCGGAGGGGCCCCTCACCCCCT 
G C C CGG CT G T G T T T CAGGGT CT CAAA CGG T G CAG CT GATGTA CGG CT G T G A CAT c CT CGAG 

GATGGCACCATCCGGGGGTATCATCAGACAGCCTACGATGGGAGAGACTTCATTGCCTTCG 
ACAAAGG CACGATGA CGTT CACTG CGG CAGTT CCAGAGG CAG G T T C C CA C CAAGAGG AAAT 

GGGAGGAAGGAGGTGTTGCTGAGAGGTGGAAGAGTTACCTGGAGGAAACCTGCGTGGAGGG 

G CTG CGGAGATATGTGGAATACGGGAAGG CTGAG CTGGG CAGGAGAGGTGAG CGGGGT CGG 
GG T'-jGGGGGGGGGGGGGG CGGACG CAGTGTGGGGT CGGACGTGGGG CGGGGG CT CAT CGTG 
GGGAG CT CAG CCCGG CCCT CACTGCCG CCCA.CCCA'CAGAG CGG CCTGAGGTG CGAGTGTGG 
G G G AAG GAG G CT GA. CGG GAT CCT G A C CT T G T CC7GCCG CGCT CACGG CTT C r « CCCQ C r.c r 
CCAT CG CCGT CAG CTGG CTGAAGGACGG CG CGGTG CGGGG CCAGGACG CCCAGTCGGGGGG 
CAT CGTG CCCAACGG CGACGG CACCTACCACACCTGGGT CACCAT CGATG CG CAG CCGGGG 
GACGGGGACAAGTACCAGTGCCG CGTGGAG CACG CCAG CCTGCCCCAG CCCGGCCT CT A CT 
CGTGGGGTGAGTGAGGGGATGTGGGG CTGGGGGG CTG CGGG CTG CCCCTT CCCCTG CTGA T 
GG CCCCG CT CTCCCCCAGAGCCG CCACAGCCCAACCTGGTGCCCAT CGTGG CGGGGGTGG C 
CGT CGCCATTGTGG CCAT CG CCAT CGTGGTTGGTGTTGGATT CAT CAT CTACAGACGCCAC 
G CAGGTAAAAG CAGAGGGGTG CAGGCGGG CAGTGGGGG CTGTAGGGGGAT C'TGGGT CCC^C 
CTTGGGAGCCCCCAACCTGGCTGTGATGTGAACCTGTGATGAAGCATCTC^CTGTCTGCAG 
G G AAG AAG G G GAAGG G CTACAA CAT CG CG CC.CGGTGAGTGATGAGGG CAG CG CTGT CCCCC 
ACCTCTGCCCAGTGCCAGGGTGGT CCTGGGGT CCCTG CTTTCT CCCAAGGTACCCATT CCT 
GGTGCTTGGGGCTGCT CCATGCCCCATAGGGAGCACAGGGCTGGAT CT CACAG CTGTT CCT 
CCCTTATAGACAGGGAAGGTGGAT CCAG CAG CT CGAG CACAGGTGCGGTGTGGGG CTG TGG 
GTTGGGAGGGGTCCGTGTGCT CT CTGTGGTA CTG CCCAGGG CTGGG CTATG CTGGGGCT CT 
G CGGGGAGACCCCCGGAG CAGAGGGTTGGGATGTGAACCTGG CCCCGTGGGA CAT CAT CCC 
TT CTCAT CCCACAGGGAG CAACCCCG CCAT CTGAGTGCTGTG CTT CAG CCTG CAAGGAG CC 
AA CAGT CCA CA CCAG CAT TTGGGGTCGGTGATGGA CACAG CCCCAT CCT-CCTGACCT CT C^ 
CAT CT CATT CTG CTT CCT ATG CTGACTGTTATG CTT TG CCTG CA CTG CTT CCTG T G^ ~ ATA 

AAATGATGGGCCATTCTGTGCTCAGCTTGCCTGCATTCTGCACAGTGCTGTGGTTGGGGAT 
GGGGTGGGTGAGAGGACCGTGT CCAGTTTGG CTG CT CAGGGTG CAGATGTGG CCCTGTG CT 
GAG TACCCA CTG CCCT CCCCCCCTAT CTG CCTGCTG CT CACT CCCCCT CCTGTACCCCCAT 
CCCTTCTCACCTCTCCTCTGTGAACCCCATGCTGGTGGTTGCTTGCTCCCTGTCCTGGC?G 
AACT CT CATT TTCCCAATGG CAT CCCTGGGTGTTGGGATGTGGTCTCCTTGGT CCT CCCCC 
CAG CAGT CA CTG CACA TAT CCCCC CCA CTT CCCCCCTAGGTTGTTGTCCCACAGCA CTCCT 
ATTT CCCTCT CCCCCCCCCCCCCCCCCCCCCCGCCCAT CCAG CTG CCT CTG CAAT CCT CA.C 
CCTTGCCCACACACAACTTTGCGCACTCCACCTCCCTCATCCCGCCCTTCCCCCAGCTCTC 
CTGT CCCTG CTGG CCCCCCT CCCCCCCCCCCATTGTACCCTACACCCAAATAAATATGTTT- 
GTT CTG CTG CCCT CCAG CGGTCT CCTGGTTTATTTCC.CCCCGATTTGTTGTTGTTGGGG CG 
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TCCGCT CTTCACCCTGGGGGGAAGGGGCTCTGGGGGTCCCT CATTCT CCCTGCA.CTTCTTA 
CAG CACCGGGACT CCCGCG CTGAGAT CCCAT CACACCCGGGTACAAACATG CGG CTTT ATT 
CC CAGTT CTGTGT CCCACCCCCGG CCCTG-GTGG CACT CAGTGG CACCGCAGT CGATG CAGT 
GGCCJTTGTGTGTCGTACAGCAGCGGTACC 
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ATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGC 
ACCTATCTCAGCGATCTGTCTATTTCGTTCATCCCATAGTTGCCTGCAAC 
. CCXCGTCGTGTAGATAACTACG. vTACGGGAGGGCTTACCATCTGGCCCC 

AGTGCTGCAATGATACCGCGAAGACCCACGCTCACCGGCTCCAGATTTAT 
CAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCA 
ACTTTATCCGCCTCCATCCAGTCTATTA.ATTGTTGCCGGGAAGCTAGAGV 



......H^u^^va.^AuaiAiiMi ioi l GCCGGGAAGCTAGAGT 

AAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTGCAG 
GCATCGTGGTGTCACGCTCGTCGTTTGGTATGCTCTTCATTCAGCTCCGGT 
TCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGC 
GGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAG 
TGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCM-G 
CCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACC^GTCATT 
CTGAGAATAGTGTATGCGGGGACCGAGTTGCTCTTGC^ 

gagI^S 



' " rrrrr a tA^V™ ™^ 1 U 1 L ^^ATCTTACCGCTGTTGAGATC 
CAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTA 
CT^CACCAGCGTTTCTGGGTGAGCA,VAAACAGG,VAGGCAWTGCCG^A 

TTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGAT 
ACATATTTGA.ATGTATTTAGAAA.AATAAACAAATAGGGGTTCCGCGCAC A 
TT-ICCCCGAAAAGTG.CGACCTGACGTCTAAGAAACCATTATTATCAtGAC 

Turner err r^nn^n^ 

I CCCCCGTCG7 CCAGATGCCCACGGGCCACGTCGAGGCCGACGGGGAGAA 

i^TGGACGGGTTGTGCAGGTGCGTGATGTCCAGCTCCGTCGTCGGGTGC 
CGCCGGGCCCCAACCGGCGGTCGGGGGGGCGGTGTATCACGCGGCCCGCT 




~rrr£rr rrnrrrr* ^ A ^^LCtxi u-u 1 GGGGGCGGGC AGGCTCGCGT 

CTCGTACCAGCGAAGAAGGGGCAGAGATGCCGTAGTCAGGTTTAGTTCGT 
CCGGCGGCGCCAGA.AATCCGCGCGGTGGTTTTTGGGGGTCGGGGGTGTTT 

^ CAG ^ATCCAAAAACCATGGGTCTGTCTGCTCAGTCCAGTCGTGOA 

TTCCCCATGGGGGACCCCGTCCCTAACCCACGGGGCCCGTGGCTATGGCA 
GGGCTTGCCGCCCCGACGTTGGCTGCGAGCCCTGGGCCTTCACCCGAACT 

^S^J^^^^ ^^^^^^^^CCAGCCCTGGGACCGAACCCCG 

CGTTTATGAACAAACGACCCAACACCGTGCGTTTTATTCTGTCTTTTTAT 

TGCCGTCATAGCGCGGGTTCCTTCCGGTATTGTCTCCTTCCGTGTTTCAG 

CCGCGCrGGAGGATCATCCAGCCGGCGTCCCGGAAAACGATTCCGAAGCC 
CAACCTTTCATAGAAGGCGGCGGTGGAATCGAAATCTCGTGATGGCAGGT 

ACTCGTCAAGAAGGCGATAGAAGNNN 
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TGGGGTCCTCTTTGGTCTGATGGAGAGAGGTTGGCACCAGGGTAAGTCGC 

rGCCTACATCACCACTGGTGTTTTGTCTCAGCAGCTGGTGTAAATTTCTG 

CCATCTGGGCTATTTCTGTAGAAAGCA-AGAAGCTCTGCTGGTGGGCAGC 

TCATCTCCCAGTGTGAAAAAGCAAAATGCAACGC ATGCACCCTGCTATCC 

ATGTGGBCGYAKCCCTCTCCATCAGCTGTTGAAGGAGAAATCTGCACTCA 

GAAGAGATTGAATTGGGCTCAGATCTGGCTTGGGAAGATGATGATTCCAA 

CCAGAGTCCAGGAGACTTTGGGGAATGCATGAATCCTATAGGAAAATGGA 

TAACCCTTCATCCAAGAGCAAGCTGGCATGATGCTCTGGGGTGAAAACCC 

ATAATGCCACCTGGTTTTAAGGTTTGGGGTGGCTTACAATGTGCAGCTCT 

GCTTCCGGCGAGGCACTGGGAGCCCTAAACCCATGGAGAGGTCAAACCAG 

TGCTGG AGCYTC ATTdTrirwir'nr a arrnn a a-t^^^ . . . . 



uv - 1 1 ^vjvjw/vjr\jv-m, i ^uua(jI_ll i AAACCC ATGGAGAGGTC AAACCAG 
TGCTGGAGGTCATTGTGGGCCCAGCTGCAATGGGAGGTAGGCAATTATGG 
ACATCGCTGAAGCCACCCCACGCTCTGGGGAACTTGGGTTTTCACCTTTC 
ACTGCACTTTAATGGGATTTCTCATCAATGTCTGCATGTTCTTGGCCACC 
TGTTTAAAAATATAATAATAATAATTAAATCTTTTGCCCCACTGCGGGAT 
GAGCAGCTGGTGGTTCCCAGCTCACAATAAACCACACTTGAGACTCCCTG 
GAGAATTCGCTTTCTTTTTGCAGCTGGTTCCATGTKGGGSYKTTCAGCCC 
CTCTGCAGCTCATAGGCTTTTCTTGACAGCCTCTGCTCCACCTATTGCTG 
AAAAGGGGGAAATTTGAGATGGATGCCATTTTGTGAACATCTCCCMACCT 
GTGGGTAATGCTCAGACCTCTCAGCCCTGTGGGTTTAATTTrTrTTTCTG 
CAGCTTAATGGGTTGGGGATGTTGATTACTGCAATAATTAGTGATGGGAT 
AGGGGAGGCAGGAGAGGATCCCGTCGACCGATGCCCTTGAGAGCCTTCAA 
CCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCCGCAG 
TTATGACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCG 
CTCTGGGTCATTTTCGGCGAGGACCGCTTTCGCTGGAGCGCGACGATGAT 
CGGCCTGTCGCTTGCGGTATTCGGAATCTTGCACGCCCTCGCTCAAGCCT 
TCGTCACTGGTCCCGCCACCAAACGTTTCGGCGAGAAGCAGGCCATTATC 
GCCGGCATGGCGGCCGACGCGCTGGGCTACGTCTTGCTGGCGTTCGCGAC- 
GCGAGGCTGGATGGGCTTCCCCATTATGATCTTCTCGCTTCCGGCGGCAT 
CGGGATGCCCGCGTTGCAGGCCATGCTGTCCAGGCAGGTAGATGACGACC 

atcagggacagcttcaaggatcgctcgcggctcttaccagcctaacttcg' 

ATCATTGGACCGCTGATCGTCACGGCGATTTATGCCGCCTCGGCGAGCAC 

ATGGAACGGGTTGGGATGGATTGTAGGCGCCGCCGTATACCTTGTCTGCC 

TCCCCGCGTTGCGTCGCGQTGCATGGAGCCGGGCCACCTCGACCTGAATG 

GAAGCCGGCGGCACCTCGCTAACGGATTCACCACTCCAAGAATTGGAGCC 

AATCAATTCTTGCGGAGAACTGTGAATGCGCAAACCAACCCTTGGCAGAA 

CATATCCATCGCGTCCGCCATCTCCAGCAGCCGCACGCGGCGCATCTCGG 

GCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCGCCCTGACGAGCATCA 

CAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAA 

GATACCAGGCGTTTCCCCCTGGAAGCTGCCTCGTGCGCTCTCCTGTTCCG 

ACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGT 

GGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCG 

TTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGC 

TGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGA 

CTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGT 

ATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTAC 

ACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT 

CGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTA 

GCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGA 

TCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAA 

CGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCT 

TCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGT 



9/31 



2771422 



CCATAATATGCCATTAGAAGTAACACATCCATCAATGATATATCCATAGA 

ATACAAGAGAACGGTCTACATTTACTTCAGATCCCATTTTCAGGTTAACC 

ATG. ' AAAAAATACCC AAAGACTGAAT . . Z ACCATTCAGGGATCCCGTGTG 

TAAAATCATGACTTCTGCTTTAATTATAAGAAAAATGAAATTCACTGTTT 

TTATTCTCTTTTAAGATGAACTCTCAACAGAAGTTGGTGAGTATTTTTCT 

GCCCTCCAGCAAAACCAAAGCATGCAGTTTGCAGTCTGTTTTGGATATAT 

ATTGTACGTGGATATATAACCTGTATGTTATAACACCTCTGGTTTCCTTT 

TCTCCTTCTTTTCCTCAGAAAAACGAGAGAGAAGAATTGGTGAGTATCAA 

ACTTCCCCCCAGAAGTGGACTTTGGTGTGTTGGGAAGATCCATACCACAA 

CGTTGGTGCCAAACTTAATGGAAATCCTTTGTTTTTTCCTTATGTTTTCA 

GATGAACTCACTGCAGAGCTCGGTAAGTCGTGATTATAACTCATAACGAG 

TTATAATGCTATTGTTATATATAATATACATATTATATATTGTTGCTATA 

ATTCATAATAGAGCAAACAATCACAAGGCACAGAAATATGGGTTTGCTTT 

GAGAGCCAAACCTTAGGAAGTGATAACACAATGGGAAGAGGACAATGACC 

ATTTCTGTTGTTCCTCTTTTCAGAGCACTACAAGGCAAAAGCAAGTGAGT 

GTCTCCTTCCTCATCTTCAGCACGTGAGAGATTTTGGGGGCTTTTGGGAC 

GGCTATGGGGATTTACACATAATAAAACAGAAGATGAGAAGACAGTTTGT 

TAACTTGAATTCAAACTGGTTTGAAATTGGTGAAATTACAGTATAAATAA 

TCTCCCCAGTACCCAATTATACAATGGGATTAATTACAGCCTGCCCAGGA 

AAGGAGCACTGAATTTTTTCCTGCGTCCATCCAGCATGAAGTCCATCAGA 

CTTAAGCTTACAGCTTAAAGAATGGTTCATTTTTTTCATTTAACCCCCTC 

GTAAGTTAAAAGATGGACTTGAGCATCACAGAAGTAGCCCAGAAATAGTC 

AAAAAATGGGTCATGAATTTCCAGAGCACCCGCCCACACTTTCCTTGGTG 

a,\taggaaaacaaatattaaaactaattaattggtttttttttcttttta 

ggaagatgttttgaggaacacagtaagtgcccttttctcccttctttaag 

catcacttttcactttaagtctgcatcacagttaataatccatctcctta 

ttatgcatttttaggGagaggcgaagaaaagttgggtaagtcatttggtt 

aattgggtttctgcttgcagaccccatccaggagctcatgtcctcctctt 

agtgtctgcactgtagaaatatccaggttagacgtgtaggtaggaaatac 

TGGACCTGCGTGGAGGTATTGCAGACCCCATTTATGTGTAGGGGAAGCAG 
AACATCAAACTATTGAGCCTTGAGCTCCACGAAGACAAGCCACCfCTCTTA 

gatttcaagcgaagtcgagctgaatagatttaattctttctttcccatag 

taaatgtgactctggacccagagacggcccaccctcgcctcgtcctctcc 

aaggaccagaagagcgtccgatgggaatacagcctgcaggaatcccccga 

cggccccgagcggttcgacgccgatccctgcgtgctgggttgtgaaacct- 

tcacctctgggaggcactgctgggtggtggatctcacagaagggcagtac 

tgcgccgttggggtcagcagggagtccctgcccaggaaaggagccgtcag 

'Ctttaaccctgatgaaggcatctgggctgtgcagcaatgggggttcaaga 

acagagccctcacctcccctccgaccccactgaaccttccacgggttccc 

aaaaagatccgcatctctctggactacgaatggggcgaggtggcgttttt 

tgatgtggagaaccaaatgcccatcttcacttttcctctgacctcctttg 

gtggggagcggctccggccgtggttctgggtggagctgggctccctctca 

ctgcccagataaccccggaatccctggaggtgctgtggaggtgccttaca 

gcagctcttccagaccggggtggaaaaactctcaggaaaagcagcattaa 

aacctcattctccctcttcccagtcaaccattgtcatgcaaaagaaagga 

aacccatcctcaatgtcatcagcatcctccgtgtgtcatgtctggtggcc 

cccattgatgtatggggtggctcctgttggtgtctggtgccccctattga 

cgtatgaggtggcccccattgacgtgaggtggcccccattgacgtgaggt 

ggcccctattgacatatggggtggctcctgttgatgtctggtgcccccca 

ttgacatgaggtggtccccatgaccagcgcctaccctggatccaatggcw 

cmygattgcagttccaaactctagggaggttaaacgacccacagagagga 
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AATCACCTCAAAATGAGCCTGAATGTTTGCACTGAGGACTGAGCACAGCT 

GGGG ACTAATTCATCTTTATTTCTCTCTTATTTACAGAGGAACGCGATCT 

GAAAATCAGTAAGTGCTGCCCCAAAC "CATAGGGCTATGCTGGGCTTCAT 

C C CC AC AACATGAATTTT AT AAATTAAATAAATAAATAAATAAATAATTT 

TATATTTTATGTATTTGATATTAGCAGTATTTAAAAAAAAGAATAAAAT\ 

ACTCAAGAATCTTAGGATCAATAGTAACACAATGATGCAACGTGGATACA 

AAAGCAGTAATTCCTATTTCTTTGGGTTTTTATCCTTCCAGGGGAACACG 

AAGCAGAGATACGTGAGTGTTATTTTATATACTCTATAATGGAAAACTTT 

TTTCTCTGTA.ATATAAAAATAGGCTTTATTATTKGAGGGGTTTTTTGGCT 

TAACGCAAATGCGAAGTGCTTGAAATTCTACGTATGAAATAGAGGATTTC 

CCATAGAGAAAAACAGCAATTTGGGGCTGGAATAAAAGTTTCATTTCCTT 

GCTG.AAAAGTGAATGAAAAGGGGGGGAAAAGAACATAAAAATTGAG^T^T 

TTCCCTCATTAATCTGTCATGAAATGGGTTGGGTTCCTGAATGGTGATGT 

CAACACCTCGTTTTGGGTTCAGCCCAACATAATATGTGTCTGTCCTTTAT 

1 TCTGTATCACTGGTGTTAAAGAGAGCTGTTTTGAACTAATATCTCTTTT 

TTAATTACTTTTTCTTTTTCTTTTTCTTTCCTTTTTTCTCCCGTTTCTCT 

CTGTTTTGCTTTAAGGGCGCCTCACTGAGCTGGTCGGTAAGTGCATTTCC 

TTCCTTGCATCTGTSAAWMCAGCWATAACCVHAGGYCCTATTTTGGGGGG 

GAAGGAGGGGATAAAACACAATAATGATGAAATCAGTGCTTTGGAAAGGG 

TGC.AATTATTATTTCTCCTGCAAATGAATACTTCCTTTTCCGTTTTGTTT 

GCAGA.GGACCGCGATTCCGATGTCCGTAAGTCCTTTTGTTTGTCCCGGAG 

CTGTGAATCCTCCAATGGGAAATGCAGAATTTCAGAGTCTGCCCCAAAAA 

■ I GACC1 TTTTGAGGCTAC AAGGGATGGGAAAATAAGGAGAAATGTCCTT4 

■.TTTATTGATCTCCTTGTTTATGTGCAAAACTGGGTGACTCTTCTCTGCCG 

'aacacgttagaaataagaacacaaaatgggaggaaatggtatttattcat 
atctgttgtttttctgtttaatttttaggagaacaggacatcctcattag 

TAAGTGGCACTTTGGATTGATAAGAAATGCAGCTCCTGGGGACGTTTGGG 
TGCTGGGATTGCTGGCACTGCTGGGGCTTTGTGTTGTGGTGGAAGTGGAA 

i rAC itcaaaagaagagaagaatgg.aattatctggagaaaaaggggaata 

AATGGAACTGTTTGGGAAAAGAAGGAGGAATAGAATGGAAATATTGGGGA 

aavvaagtgaaaxagaatggaattatttcaaaaaaaatggaatgaaattta 

uugagggggaaGgggaagtggaatggaattatttgggggagaaaaagggg 

/Naaattgaatgactggggggggaatggggaaataggatggqaktwtttta' 

aaaatacagaattgtgaaggtttcagcccatctcagagagtttggtatcc 

tcgagttccccctttgcaacccattgagcatccttgggatgacacgaaat 

tctgttttctccttttcaagggaaactgtcagaagagctcggtgagttat 

T rCC ACT rCTTAC ATAC AAAACTGATTCTGGATAATCCTTTTGTGTGTTT 
TCCTGCTTTGCCTCTTTGTGTTTTAAGAGGCAACTGCAGAAC^AATGGKA 
CAAAGGGTGCAGAGGATCTTTGGGATAAATAACAGGGAAAACAGGGATGG 
GATAGCAATGAGTTGGTGCAATAATCTATGGCACAAAAGGTGACGGCGTG 

tttcacattttgctttttctcttccttttagaggaattaaggggtcggga 
agttggtaagtgagattcctttccctcttctccccaaaaggataaggggt 
aatttggattctgatctctttttctccctttttgttcctagaggagagtg 
ttctggagaggggtgagtatcattctctttctactgctgcttttgactga 
aggaatcccccataagcatgctggtgggatgggaattctacatctgatac 
acaattattatcatttcttcattttttatacacagaaatagataattttt 
ttcctttcttttctcttttcccccttttttagaggaacatgatgccagaa 
ttggtacgtgtccatctccccctgcttttgtggtgtcttcaagaag^— 

ATGGGGTCATTTnnrTATTr.TTTnn/^TTn a a TT^nTTOT-^-o , ™ 



j j v> v, i v_rv^ i i i lUlOUHjlLl 1 U AAGAAGGCCA 
ATGGGGTCATTTGGGATTGTTTGGGTTGAGGATTGGGTTCTTGATTGAAT 

ttgggggaggattcaggtgcccaaacacaacatcaggtcccatctcatgt 

TTTCCTATGGGCTTGGATCCTTCtGTTGGATACCTAAGAATACCTGAAAT 
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TCCTGGJ2GGCAAGAGGGCACCGCCGTGTAAAAAAWACATATATTTAACCA 

TTTTTCCTTCTTTTTTTCCCATTTAGGGGACCGTGACTCAAAGCTCCGTG 

AGTGeCACTCTCCTCCTGATTAA/^TCTGAGTGAAGATGTGGATTTTCCT 

C AGTGTGCTCCT AC AATCTC ACTTTTTC AGC AC AGTTTTC C CC AAANTTT 

GTGTTTCTCCACCCAACCCCTTACACTGATCCTAAATGGGTGTATTGCCT 

G/\ATCAGTGGTTTTCTTCCCTATTTTNGATCTATCCNGTT fTATTCC AGT 

ATATGTTTTTATGACATAATTTTATGACATATTTTGTTGTATGATGCCCA 

TAGACCTTATTACCATTGCCTGCCCCTGTGTGGATCAGAAAATATATTTA 

ATATAAAACAGATATCTCTACTGACAGTGATTTCTGATGCACCCATGAAG 

GAAAAGGATTTAAAATAAACTTTAATTTTTCCCTTTTTAGGCAAACTGAC 

AGCAGAACTeGGTAAGSACMTKKYCKTCSYCATTCCCATAAAACAAATGA 

AATTATGGATGGATGGATGGAAATTAACCAGTTAGTAGAGGTCAGC^^G 

CTCTAGGACGGTCTGAAAAGTGAGCAAAATCTGCTTTTACTCATTTTTCT 

TCTTATTTTTTTGTAGCAAAGTGCGATGCAACGATCAGTAAGTGCTGCTG 

CATGTGGGGGTACCTCCATCTTCGGGTCATTTTCTGCTGTTTCAGCATTG 

AAAGGACATCAGAATTCCTTAAATCCAACAAAATTGGGGTCACTCGAAAG 

GAAATCTTTGCAGATATGGGGGAAATCAGAGCCAAATTTTGAGGGGGGGA 

GGG AAAATCTCAGGGGTGTTTCAGAAATCCAATGGGATCTGATGGTATTT 

TCTGCTCTCAGGACTGTTTACAGTGGAACTCGGTGAGTCCGTTTCCTTTT 

TGTTTTTTTTTTCTAATTATTATTTATTAGTAGTATTATAAATCAATATT 

ACTGTTGCTTATACATATTGTTGTACATTATATACATAATACATACAtTA 

T ATAC AGTATAT AGT AT A C AGT AGT AT AT AATATT ATGTATT AT AT AT AT - 

ATAATGTATTATAATAATGTCATATCTAATATATGTCTGTATTAGATATA 

ATGCATATATATTATTGTACTACAGTCATATTATAATACATTTACTTATA 

TCTGCCTTTTTCCACACGTTTCATTGACCTGATT.AAAAACTAAATCCTAA 

AGGCAGAAGAAGATGAAAACCCCC AAATTAAC ACC AAAT AATTGC AGCTA 

TAGATCATATCTATCAAAAGCAAATTTGCCTTCAGTCCACATCACGAAAT 

TAACAATAGAAAGGTTTAAATTTGGAACGTACAAACAATGACAAATAACC 

CCCAATGGCTTTTCTCTTCTTGCAGGAGAGCGTCACACCAAAATAGGTAC 

GTGAGGTGTTTGCTACCTTCGTTTGGAAGGAAGAAATTGCATTAATAAAA 

CCTCTGTCCAATATG|AAGCCGGGGTCAAATTACTCAT.A.AATCACCACTGA 

TTGTCCATGAATTAACAGGGAAAAAAAAGGCTAAACTTGAAAATAACATT 

TTTTTCATCTCTCTTTTAAGGGGAACTCACTGCAGAAGTTGGT.AAGTCTC 

TTTCCCAtCAGTTTAAGCAAAAATGGTTCAtCAGATATATAATAATCCCT 

TATTTCTGCTTGTTTTTAGGGGACTACAACAGGAAACTTCGTAAGTGCCT 

TTAACTTCTCCCATTAAGAGTTAAACCTTTCAATATTTTTGATGCTTCAA 

TGTGCTGAAGCCACCAAAAATGTGTTTY.AATTGTAAAGGGGCTGAGCGTC 

AAACCTGAACACTGCCATGTTGGGGGCTGAGATTCGTGGGATTTGGGTTT 

TCAGTGTGAAAATGCCTCTGGGTTTCTGTGCCTGAGCTGAGGGAAACACG 

ACCAGGGCTTCCCAGTAGGAATGAGACCCCAAAATATTTCTACCTGGGGS 

CTTTTCCCATTGGGGAATTTATTCTGTWAATCCATATTTCTCCMCSTTTG 

ARCGTYMCTCMTCMAATGTCACAATCTTGGCAATGTTGAGAAGATATATA 

gatatctattttaatactgattaatatggaggtgtttgtgttggtcagtg 
atgtcatcgggaaaagatctgagtcattgaatccccatttcttttctctt 
tattttaagggaaacacgcagcagaacttggtaagggaattccctccctg 

GGTTTGTTCTCTTGTTTTTCTCTTTTGGAGGGGGATTTTTTCTATGTCTT 

CTTTCTATGTCTTCTTTCTATGTCTTCTTTCTATGTCTTCTTTCTATGTC 

TTCTTTCTATGTCTTCTTTCTATGTCTTCTTTCTATGTCTTCTTTCTATG 

TCTTCTTTCTAAGTCTTCTTTCTATGTCTTCCTTTCTATGTCTTCTTTCY 

AWGTCTTCTTTCKAWGGTCTTCTTTCYAWGGTCTTCYTTCYWWCCTTCTT 

TCTTTCCTTCTTTCTTTCCTTCTTTCTTTCCTTGGATTTTGAGCCAAAAA 
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TAGAAGAATGGGATGCAAAAATCAGTGAGTGCCCTTTTTTCCTCTCCCTT 
CACGGTGAGGTATGGGTGTGGAGGACCTGAATTAATGTGAATTCCTCTGT 
TTTAAGGGAAGCTAAC AGAAGATTTTC GTAAGTCGCTT ATTTTCCTCGAT 

CTGAGTGCATATTTCTACACCTTTACCATCAGTGATGACCAACGTGTGTA 

TGCATTTCTCTTTATTCCATTTAGAAGAGAGCGACACAGAGCTCGGTGAG 

TGCTTTGG.GGTCTTATCAAGGTGGAAAGATGGCCCTCTGTGCAACAGTGG 

GGATTGGGAGAAGCGCTTCAGCTCTTCCATTTATCCACATCTGATACCCA 

GATGGAGTCAGGATGCAGAACTGGAGGAGGAGGGCCAAAGCTTTGGGCAT 

TTTGGGGTTATTTTTGTTCCTCGAGAGCTCCCAGGATTGACCCGTGTCCA 

TTTCTGTGTTATTTCCAGAGGAATGTGACACAGAAGATGGTGAGTGTCCT 

CCGTGAGAGGGCTCAGAGAAAGACTTCCACCAAATCTCCCTCCTTTAATG 

TATATTCTGATGTATTTATTTAAGGGGATCTCGCASCTGAGATCGGTAAG 

TCGTGTGTGGTTATACACCCCTATKTGTGCCTCCCATCAAASAGGrGCTCT 

GTGCASCTTGAGTKGTGTTCCCACAGGGTTTGTCYCCCACTCTTCACACG 

AATATGGGGGTAAAACCC AACAAAATGGCACAGAGGGATTGCAGAAA GGG 

CGGGCGTTGGGTGGC GCTGTGTTCTGATCCAAGGGAGGGTGAAGCTCATG 

AGAATGGTTCTTTCTTTCTCTTTTTGAAGACAATCTGACTGCAGAGCTCG 

GTGAGTGCTTCCGTTTCCTCTCTGCTTCGTTTCACTGTTGGGTTTTTAGG 

GGGGAAAAATGCTTATTCCCCCCATAAACACACACATGTAACCCAACCTG 

GGCTGGAAGAAGGGTCCAAACGTTCATAACTGGAGACTGCAATTATCATT 

CCCAATTGGAAGGTGATTCCATCATGAACCATCCACCCATCACAGTGGAA 

TTCTGACAGTGTTTCTCTCTGTTTTCCCTTTCAGAGGAACGTGATAGGAA- 

AATCAGTAAGTGCCTTTTTCCTTCCAGAACTGAIGGGAAGCGATGGGTTA 

GGGTTAGGGTAAGGGTTAGGGTAAGGGTTAAGGITAGGCTTGGGGAAAAA 

TAAGTTAATACATTTCATTATGGCTTAGAATTGAAACTAATGTTCATCTA 

TTTCTTTGTTTTAAGGAAAGCTCACATCAGATCTTGGT.A/AGGGTTACTTC 

CTTTAAACTATCCTTAATTCTGCAACAGTGCTGGGTATAGAGTAGAAAAA 

TATGCATGTGAAGGTGTATGTATGCACATGTTAATTCATTGCTATTTATG 

TACTCGTTAGTTGCTATATATGTATTAATTTATTCACATTATATATATAT 

TTGTATATATTTGCAAATATTTGTATGTATGTGTGTATGTGTGAAGAGAT 

TGGGGTTTCCTCTGGTTGAAGAGGGGGGTGAATGACAGCAGGTGTCCTTA 

ATAAGCCTTATTTTCAAAACkCTAACAAGGGAGAATTGGGATAGACAGAA 

ATAAAGCC.TAAAAATGGGAAAAAGAAAAGAAtGAAATGGGTAAAATATTG 

AAAAGAACRAAAARTTTGGAGAAAAGAAATGACASTTTTGGtTGGGTTGG 

GGCTGCTCTGCATTTCTCCRCTTATTTTCTCCCTTTGCTTTCAGGTGATG 

TTGACACAAAGCTCAGTGAGTGGAGCTGCTCTTCCTGCCCCACATTTAAG 

AGTATTTTTGGTATTTTTAAGACTGTTTAAGAATATTTGGACATTTCCTG 

tggaaaatggatttctggtctgtaaaaaaaacctggggcttatttttgag 

gacggaataaatgtcccaaaaaagggggattttggcatcaattgactggg 

aggtgaaaaataaaagcagtgatctgagcgtgttggggccaatggatgaa 

CCTCAATGATCATTGTGGTCCTTTTCAATCCAGGCCATTCTATGATTCTG 

tgaaagaaaagaagataattaacatttaattttcttctttctcttctcat 

tccagaggaacgcgacaggaaaatcagtgagtgtcacttttttggggcca 

aaaccctctgatttggggaagggatccctgatagaagtggttaatcctgt 

TGGTTTTTCCCTCCTTGCAGCCAAACTCTCAGCAGAAATACGTAAGTCCT 

TTTCCTCCCCAATCTGAACTGTTTCTTTGTATTCTTAGACTTCCTTTTTT 

TTTTTTTTCTGTTTTAATTAAAATAATGCTTTTTTTTGGTTGGTTTTTTT 

TTTCCCTATTTGACAGGCAGACTGACTGCACTGCTGGGTGAGTGGTGCCA 

TTAAATCCGTGTGTGGTTTTGGGCTGAAAACCCTTAAAAATGGGAACTCT 

GCACCCAGACAGMYYATSGTCWKWGCTTTKYYWCATTTGTAATAGAATAA 

AAATGGGGGGAAATGGGCA.AAATGAGCATTGCAAGKGAGCAGAGYTGCTG 
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CCC AA AAT AGGC ATG ACTC AGC AAGC AC CGT AGTGGGC ATG ATTTGCTTG 

GGTGACCCCGTGGGTAAGGAGCCATTTGTTGGACACCACGATGTCGTTTT 

TCA CAGCCCTGTGAGCGCAGCGTCTT ATTGCCCTCCAGACATTCCAAA 

TTTGGAGAGCTCAAATGGCAAAGGTGAAATGGGCGTCAGCCCTCCGGGAT 

GAAGGAATCTCTGCCGGGGTTTTCCGTTGGATCACAGCAGGAGGATTTGC 

TTTCCTAAAGCATTAGAGTGACGTGGAGAGCCCAAATCGGACCCAGTGGC 

CACATTCTCCCAAGGGAAAACCCTTCGGGTGCCCCTACGGTTCCTTTTGT 

AGCATGATAACAAACTTCTTTTCCATCCGCCCATCCCCTTTTGGGTTTGG 

AGGTTGACAAATCCCCACTGAAATTCCTATGTTGCACACATGTCCTTCAT 

TCTTTAAGTAGGAGTTAGCAAAGGTTGCGCATTGACTTAATTCAGAGCGA 

GATGAACAATTTTAGGCATTCTTTATGAACTTCACATTGTTTTATGGTGA 

TCAGG^GCAAAAAAACATACAGGAATAGGAGTGTGTCTGTAGGAGTGCTC 

TGCATTTTCTTGCTCGTTTGGCTGATTAAGGAAGCTGGGAGGAAATGTTG 

TGAAATAATCCCAAGTGATGAGAGACTGTGGGTATGGGAGGAGATGCCCT 

CTGTCCTGGTGAGCAGTAGGGACAGAAGACCTGAGCTCATTTCATATATC 

TGTATATTAAGGCAATGCTAACCAGTGCTGTCGTGTTATTTGGGGCCAGG 

AGTGGCTTCTGCCGGCGTTGGTGCCCATAAACCAGTGCTGCCCCATTKGG 

GATTGGGGTTNTGTTGGCAGACAACATCCACCAACCAACCCATGGCTGAT 

AGCAGAGAGGCGACCAGGTCAACCCTCCATATATCTCTGCAGAAACCTGT 

TCCTGTCTATACAGGGATCCCCATCCCTCCCCCAGCCCTCCTTCCATCCT 

CGGCATTTGGGTTGGCTATAATTAGGGTCTGGGAACGTTGCCCTGCTGCC 

AGCACAGCTGTCGTGTCTGCAATGATCCTTCCAGCTCTCTGCGGACAGGC 

AAACCCTCCAGCAATCCTAAATACCCATTTCCTGCACTCCTGGGACAAAC 

TGGGAGCTGCCAAAAATCTCCAGCCCCCCACAGACGTGACCATCACAGCA 

CCAAGGAGCAGAGCAAGCGCAACGTGATTACGGTGCAGGTCGGGGTAAGC 

CTTTCTCTTTCTTCCCAGAGCCCAGGATTTGGGGGATCCTATTGGCTCTA 

TGGGATCT.GGGAGATGCAGGAGAAATGTGATCGCTTTGCTGTAGCAAAAC 

AACCTTTTAGAGTCCTGCACCTGAATCTGGCAGTACTGGAAAGCAGGAGA 

GGG ATT AAG AGT C CTTCT GC ATT ATC C T GCTC AT AGGG AAAT AC AGC AC A 

GAAATCATTGGGGCTGCTTCCTTTGCTTTCTTGGCACAAATTTAGGTCCT 

CATTACAGCGTTTCTTTGACTGAGACCCCAATAGGATCTACAGGGGTAGA 

ACAAAGCAGACAAAAAGTGATTGATGTTTCCTATGCGATTTGTTGCCTTT- 

TCCCATTGAGATTTCTGCTTTTCCTATGGGGCTTTTTGCTTTTTCAC AGC 

TTTTTTTATTCACTGTAGTGAATAGAAATTTTTAGGGCTTTTAGGTCATT 

GATGCTGTTATGAACACAGAGATGAACTCATAACACCTTCCTGGTGTGGT 

TTGTCTATGGGATAGAAAGGAGCTCATGGTGCTGTGGACAACTAACAGAG 

GTGCCTGAGGGCTGGGCCCTCTTTGTGCCCCTTCTGGGGGTCAGCAAACT 

CCTTTTATTCAGATATAAATCCCCTCATCCACAATTTCACCAGTCTTCCC 

AATGCAGACCC'CAAAAAACATCCCCAATGACAAAGTCCACGAACTGAGAA 

AAGCAGCAAAAAGCCTCCCAGCCCCAAATATTTATCCCTTATCCCATTTA- 

TTTCTATGGGCAAAGCTATTCTAGGCATCAGGAAGGTGGGAGATTCCAGG 

TCAGTTTGTTCCTAATTGTGATCTTTTAATGATGTTTCTCCCATCAGGTG 

GACATTTGGAAGTGGTTCTGACTGGGAAGAGGACGTGATGATGGCATCAG 

GTAGAGCTCAGAAAGTGGTATTTATGAGCAAAGCAATTTTCCAGGTCTGT 

TTTTTCCCATTTTTCCCATATTTTTTTCTTATTCAGGGAAGAGGAACGCG 

GATCTTGGTGAGTGATTTTCTTCCTTTTACCTTCAAAAAGTCCCTTTCCA 

TGTGTAGAAATGGATATACGTACCCCCCACTGATACCCATTTCCTTTGTT 

CTGTCCTTATATTTATACTTCCCCATATTTTGAACACATGAAAACAAAGC 

CCACATTAAATAAATTCATAAACAGTGCAATTTTTGGACTATTATTTTCC 

ATAGAAAAGTATTAAATCAGTGCAGAAGTGCCTCTGGAGGTGACTTCTGC 

AGCACCCAAAGAGAGAGGCGTAGGGCTGAGTGCTCTCTCTGTCTCTCTTT 
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GAAAGAGGTTTATTTTCACAGTGTGGAAACTCAGATCCGTTGCCTCACCT 
GCACCGTGTATTTGCAGACACCCAAAGTGTTCCAGAGT'TTGATGGTTTTG 

TCCC T GGAGCCCGAAACGATCTGGCGG'TC-TCGGAGGAGAAGGCGACGCT 

CAGCACAT'CCTTGGTGTGGCCAACAAAGCGGCGGGTGGTGGTTCCTCTGC 

AGGGACACCAGGAGGGTCGCACGGGAGGGACAAAGCTCAGCAAACCCCCA 

TTAAATTAATTAACCCTCCCCTAAATTGAGGAGATCGTGCTGCAGTGCAT 

AAATTCTTAATGAACACAACTGATGGAAGCAGGAAGGAAGCTAAAACGGA 

GTC ATCTCC AC ATGGGTTGAGGAGTGGTGGTTCCTTC CCTGCTTC CGAAC 

AGGAACAAAAGGGTGCCAAAGCTTTTGATATAGGGTTGGAATAATCATGA 

GGAGTTTAGGATATAAAACTCAGCTTCCGTGGACACACAGGAGCGTAAGT 

GCTGAACGCTTTTGGAGGATTGGGGTAGTTCTGCTTCCTGAGGAGTTTCT 

TCTCCTATAGTACTCCCAAAAATCACAGTGCAAGAAGAGCCGGTGCTGCT 

CCAACCTCACCCCAAACTCTGTACCCCAAAATCACACCGAAGGAAAAGCC 

TGCTTGCTCCAGTCTGTACCCCACAGCGATGGTGAAGGAAGAACCAAATC 

CCCCCCTGCTGCTCCACSTGCTTCTCTCCCATCATAATTGCAGGACGTGT 

CCTCAGATCCCGGAGGATCAGCAGACTGTGTCAGGTGTAATCACTGGGAG 

AGTGAGCTGAGGGAGGAACCGCTTTGGTCCTCCCTCCAAGCATGATTTAC 

CACCCAACCTGAGAGGAACTCACCT.CATTTTCACGCTGTACCGCACACCT 

CTCACCCACCCCAACACCCAAACAAAACACAGAGCCCAGTTCTGCCCCAA 

ACCCCCACCCCAAAGCCCTTTCAGTCCCCAGGACTCACGTGGTGAGGTCC 

CACAGCCTCAAGGTGCCATCCCAGGAGCGCGACAGCGCAAACTGCCCATC 

GGAGGAGATGACCACATCGCTGACAAAGTGCGAGTGGCCGCGCAGGGCGC 

GCTGCGGGATCCCGTAGTTGGTCTCATCTCGGGTCAGCTTCCACATGATG 

ATGGtTTTGTCTGGGAAGGGGGAAAGGCAGCGGCCTCAGCTCCAACCCTT 

CTGACATTCCCGTCCTCACTGGGGTTTATCTCCCTCATAGCAATGGGGGG 

GTTACACAGAAGCACCGCACCCCTTCCTCTCAGCCCCCCAACCGCCTCCG 

TAGGTGCTCATACACAGCAGCCTCCCCACCCTGCAGCTCTCTGTCCCCGA 

GCCCTGCAGCCC ATTCATC ACCTCCCCTCCCCS AWGGTGCCCGCCAGCCC 

CCTCN1TTAYCACKGACGGTGTCCCCTTATTTCCCACAGTCGCCTCCATA 

GGCCCCACAGTTCCCTGCGCCCCCeCACCGCACAGTTGSGCCCCCCCCGC 

C'rCGGAMGAGGCCCGAACCCCTCAAGGCGGGGCCCTCACCCCGCGACGSG 

GAGAGAATCATGTCCGGGAACTGGGGGGTGGTGGYGATCTGCGTCACCCA 

CCCATTGTGGCCYTTCMGGGTACCGSGGAGGGTCATCTGCTCCGTCATGG 

CGGC GGCGGGGCGG AGGG ATGGC GGCGG ATTC AAT AAAGGGCC C GGCC C G 

GTCCGGTCCTACCGCCCGYGATGGGCGCGAGCGCGGAAAGAGAAAGAGGG 

AGGTGACTTC C GGCGG AAGC GG AAGT AGC C GCTGGGTTGT AC GGC AAG AG 

GGGCAACATGGCGGCGCGCATAGAGAGCACGCTGAATGGGGGAATGGGGC 

TTTTGGAGGTGGGGAGGGAAGGTTGTTYTCTGCCGCTGCAGGRACACGAG 

GTGCGGGCAGAGCACCTTCTTTAACATTTGKTATTAT.TTAACGTTTWACA 

TTTAGCATTTTTATTATGCCTGTTGTGCCAGGACGGAGAAGAGCAGGGTG 

TGCAGCCTGTGCTTATCACCTGCAGCTGTCCCTGCACCCCACAGCCAACC 

C AAGTTTGTGAC GCCTG AGC AGG ATCTG AC C C AGGAAGGC AAAC AGAAGG 

TCTGAGTCCTCCTCCCTTTCCTTTCCCATCCCTCCCACGCTGCAGTTTGG 

GGGCTGTGACCCGTCCGCGTTGCTCAGTGCTCATTCCGATGAGCAGTGGC 

TGATGGTGATGTTCACAAGTTTTTGGCATCCCTGTGGGTTCCACCCCCGT 

TTTGTCTCACCAGCCTTTTTCTATCCGTCCTTATCAGCAGATCATCCTTG 

TTATTAGATCTGTCTTTTTCCAGTCACGGCTTTGCATTTTCACCTTGGTT 

TT AC C ACCTAAC ATC AAGC CTTTTGTCCCC ATCTG ATG AT ATTC ATGC AG 

ATAAATCCGTAAAGCAGGGAAGAATTAAATTCTGGCCCCTTCTACACCCA 

TTTAGGTTTAGATCTTTGCAGCATTCAGCCAAGACGTGCTTCCAGAGCCA 

GGAATAACGTGTCTTGATGTGCCAACACACCTTGAAATCCAGAAAATTGC 
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GGCCTGGCACTTTATTTAGGGCCACGTAGGCCGGGGAGGGTGCAAAAAAT 

TGGGCAACTTCCACCTCTGAGGCTGCTCAGAGTGCAGCATCGCACCAGGC 

CGCACCGGTGGGAAGCAGCCTTG" TTCCCCTTGCAGCTTAAGAGCTCTCT 

GAGGTGGGGGTATTTATTTTCTCTTCCCTTTTCTCAGCTGCTGTTGAATT 

TCCAGCTGAATCCTGTCCCACCAGAGAGACTCTGATTGCACCCTGTTGTG 

TTTTACTTCTTTTTGTTGGTGGATTGGTATTTTTTTTTTCTGTTGGCGTT 

ACAGAGCTAGTTCAAAATATTTTTGGCTAAAATAAGAATTAAATGGAGAT 

CTAGTTTTTTGAAATGTCAAGAAATAATAATAAT.AATAATAAAGAATAAA 

GAATAAAGTTTTAAAGCTGAGCCTCTCCCTTATTGAGAGCCCCCAGGGGA 

CAGGAGTTGTGGTGCAGGCCCCCCAGTCTGCTGTTAACTCCTGCTGGTAA- 

GATGTGACTTAAGCCTTGCATCGTTAATCTTAACTTAATTAGCAGTAATT 

TGGATTGGGGTGCTTCCCTTCAGCAGCTTGTAAAGGGATAGAGGCTGCTG 

GGTGAACTGAGCTCTGTGTTACCACCTCTCCTGCTCTCCCCACATGTTTT 

TGGTGGTGGTGGTTGCTTCTTTTTGGCCACGGCTCTATCtCCCCAGGTGT 

GCACTCACTGTGGGCTGCTACTGCTCeTGAAAGGGCTCAGGGAGACATTT 

gagtcccttcgtccacacgtgggaggagagcactgatgtccccatcctta 

aagttgtgggcacagccttggtggcaaatccagaatgggatataatgcag 

ccatgagctcaacagagcgctcttttattgagttttgtgcataaaatctg 

tgtgttgttaccacatcctcatctggttccaatggtgacttgccacaccc 

ggacgaggttatctgtgtagccagcaaacagcgtctggggagagaaatgg 

aggaagtggatcatgaaaagataggaatcaggcctcggtgtgaacgtaaa 

aatgtcagaaggcagctg.ccaaaggggaggtgct.ggaggaaggtgggagt 

tttaaggctgcaggaggagcagtgaaaagggaaaggagaaggggatattt 

ctacctgcccatctgcagaccacgccagagaggtacactggggaggctca 

ggtttgctgctggtgctgatgacctcctggttcagctcatccacaatgat 

tttgccttccaggtcctgtgcaggacagaagagagcgtgagggactaagg 

tcctgcagggagactgctgtagccaaacccaaccattccaactcagaaca 

ggctcagggtgctcagaaacagcctctgggtttccgcacagggatgcagt 

cagatggcatcgaagtttcatcacagcagagtggtggctgtgccccacac 

caccctcccagtccaggggatgacagtgccaccagcatgacccatcccac 

gtaaccaaaagggctctgcaccaaggcatctgtggggcagggcgaggatt 

tcgagcacaactctgcctcccaaacccaacaggataagggaagtgattct 

ttaggaggtaaatagggatgtcacatacccagatcttgatgctggggccg 

gtggcagcgcagagccagtagcggttggggctgaagcacagcgcattgat 

gatgtcccctccatccagcgtgtacaggtgcttgccttcattcaggtccc 

acagcatggcctggccgtcctggggggcagcaaagaggaatcacagcaaa 

ccatgaaacctgtggctttgttccagttgtccatctaaaaccttccagct 

tggaaacagcagttgatttgtgactgagatgtgggtgagttgccacagga 

cagcaagaggcacataactgagctgtgagaacaacagaataagctgcaat 

ttggcctcagctttcccccagggtgtaccttgcctccagaagcacagagg 

gagccatcaggggagacagtcactgtgttcagatatcccgtgtggccgat 

gtggtttgtcttcagtttggagttagccaagttccaaacctaaatgaggg 

taaacgtgacaggctcagaaatatggaggagaaaaaaaacaaccctctca 

tgatcactgctcaaatattgcccagaacgccgcacaaaccccaaaggagg 

tgctcctctcaccttcaccagcttgtcccagccacaggagacaatgatgg 

GGTTGCTGCTGTTGGGGGAGAAGCGCACAC'AGGAAACCCACTCAGAGTGG 

ctctcgtcctgaggagaggaacagcattgggttgaaagcaatgaaaagca 

tccccagtccgagctgctgcatcccactgctccctgagcccctcataatt 

gcaggacgtgtcctcagaccccccccagaaagaaaggtcagcaggcactg 

tgtcacttctaatcattaggacggagctgggagatgtggattacggatca 

aaacgaacaaatcaaagagaaatgggggaatagggactcagaaacaagca 
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GTGGTTTTTGAGGGAAAATGCCGGGGGGGGGGGGGGGCH3GGGATATGCCC 
TGAGAGATTTAGGGTCTGTTTTGGTAAGGAAAGCCTCCAGCAATGTGTGG 

GCTGTGTCTTTGTTCTCTGTGGGGAA^GGAATCATCCAGGCTCAGTGCTG 

AGTTGTGGCTGATAAGAGGATTTATTGGGAGCAACGGTGGGATTGGTATC 

AGTCATCCCTAATCCTTTCCTTCTCTTTCCCACCTTGCTGCCTCCTTCCC 

ACAGGACATCAAGGGCACTTTTATCAGGTCAGTGACTTTGTTTGCATCTT 

TTCACTTTGAATAACTTTTCTTTTTTTTAATGTCAAAAAAGCATTTGAGC 

TTTTGTTTTAAATCCTGTGTGATGGGTACAGTTGGGGCCTGGTAATGCAG 

GGGAAAGCTGTGTCCTAACTTTTGGGTGATGGAAACTTCTGGCTGATGGG 

GTGCAAATGGGATCTGGGGAACAACTTGGGAAAAGACTTGGGAACTTGGG 

AAACAACTCTGGGGCCATTTGGGAAAGGGGAAGGGTGGGGAGGAGATCTC 

GGCCCTGATTTCTGGAAGCGTGGGTGTGCCCATGCAGACCTCATGCTATA 

GCGAAACTCCTCACTCTGGAGAAACGATTCTGCCCAT'CCTGTCAGACAAA 

TGGGCAGCGCTGGGAGTTCTCAGC'CATGCTGGACGCACGTGGCTCTACCC 

CAGCTCTGTCTGCTGGCTGAGGGAGGGTGGGGGAGGCT'GGCTGCACCAGT 

GCAACCAGTTTGGCCGATCCATGCGTTGCTCTGGTTTTTCCAGAGCTGCA 

TGGAGGCCGCCTCACTTCTTTTCTGCTGCTGAAATTCTCTGCTTTGCTCC 

TTTCCCCCCACCCAAAAAAGATGTGAGAACATCAAATTCCAGGAGCCCGA 

GATGGTGCTGGTGGACGTGGGGAAGAAATACCGCAACTATTTCCTGCAGG 

ATGtGQTGATGAGAAAGATGGAGAAAGCCTTCAGCAAAGTTCCACAGGGT 

GAGAGAGTCCTCTTCCTTCTAGGTGGGATGGGGTTCCCTCCACTTGGGAT 

GGGATTTCTCCAGGTCTCTTGGGGTTCTCCTTCCATCTCTGTGCTCCCAT" 

GGTTTGCAGCCTGATGATCCTTTAGGAAAAGCAGCATCCCTCTGTTCTCT 

CTGTGCTTTTCCCTtTTGCCTTGTCCTGGGTTTTCCCCTATTGTAGGTCC 

TCCATAGAACTGGGGlTGATGTGGATCTGGATTCATTATAAAGGAGGGAT' 

GACTGCCTCAAACTCAGGATGGTGCAGATACGCAACCAGATGAGGATTTA 

GGACTGGGGTGCAAGGGGGAAAAAAGTGCCAGGTGACCCCCTAACGACCC 

CCGCTCTCTGCCCTTCCTTGCAGCTGACATCACGCTGGACCCGGACACCG 

CTCACCCTCGCCTCAGCCTCTCCCTGGACCGCCGCAGCGTTAAGCTGGGA 

GAAGGACGCCAGGAGCTCCCGAACAACCCCAAACGCTtCGACTCCGATTA 

CTGCGTCCTGGGCTCCCAGGGTTTCACCACAGGCCGTCACTACTGGGAGG 

TAGAAGTCGGGGGCAAGAAAGGTTGGGCGGTGGGGGCTGCACGCGAGACG 

.GCTCGACGCAAAGAAAAAACCATGGGGCCTCATCAAAAAAGGGAGATCTG. 

GTGTGTTGGCACCAATGGGAAGAAGTACCAAGCGCTGACGGCCATGGAGC 

AGATGGCTTTGTCACCCAGCGAGCGGCCCCGGCGGTTCGGTGTCTACCTG 

GACTATGAACGGGGTCAGCTTTGCTTCTACAACGCTGAGAGCATGACCCA 

CATCCAGACCTTCAACGCTTCCTTCCACGAGCGCATCTTCCCCTTTTTCC 

GAATCCTGGCTAAGGGCACTCGTATCAAAATCTGCACGTGATGGCCCTCC 

AGCTTCTGATTTTTTTTTTCCCTTTTTCCCCCCTGCCTCATCCTTTGGGT 

CCCACTTTGGGACCAGACGCTGCACTTGTTGTCTCGCACCTGCTTGCTCA 

CAAGGCCTCTTCCCTCCTCTCTCCTGTCCCAGCCTCTGTCCACGTCCCAA 

CTCTTCTCCGGGGTCGCGATCCCAGGCTGGTTTGGTTTGGAGAAGGGATC 

CAATCTCCTTGCTGGAGGTTTTCCCTTCAGCTCTTGGTGCTATGGGCTCC 

CCTCTGCCTTTCCCAGTCCTCGCAGCAGCTTTCGAGTGTGCTCTTCCCCG 

TTTTGTTTAAAGCCTGTGGTCGAGCTTTGCGTTGTTTGCCCTCTTTGGAT 

GCAGAGCTCGAGCTGAGGATGCTGGGGTCTGTACATTGTGACACGAGCAC 

TGCTTGTGCCCTCTTGGCCATTGCTTTCTGAAAGTCACTCAGATGCACCA 

AGGAGCCTCATTTCTTTTTATTTTTCAGTTCTGGGGCACAACCCTCTGCC 

CACCTCCCACCCAGCCACCATCTGGACCTCAAACCTTCCACGTTCTCCTA 

TTCTGCCACTTGtCCACCTTCCCCTTTTGCTCTTCTTCCCCCTCTGGGGG 

TCTCCAGCTCTCCCTCTGCCCCATCATTCCCTCGCCAACCATTTCTTGTG 
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AGAGGAGGAAGATGAGCTGGGGGAGGAAGAGCTGGACGTGGAGCAGGAGG 
AGGAGGAGGAGGATGGAGGCGGGGAGGAGGAGGAGGAGGACGACATGTGG 
AGC GAGGAGGAAGAGGATGGAGAGC . u i GGGAAGGTACTGGGGGTCGGTT 

TGGGCCTGCCCTGTTGAGTGTCTTTATGGATGAGTGAGGGAATTGGGTGC 

ACCCTCAGTCAGTTTGCAGATGATGCTAAGCTGGGGGGGTGTACTGATCT 

GCCTGAGGGTAGGACGGCCCTACGG.TGGGGTCTGGACTGGGCCCGATGGG 

CTGAGGGCAATGGGGTGGAGTTCAGAAGGACCGAGTGCCTGGTTCTGCAC 

TGAGGTCACAACAACCCCATGCAGCTCTACCTGGGGTAGAGCGGCTGAAA 

GCTGTGTGAGGGAAAAGGATTTGGGGGTGAATATGAGCCAGCAAGAGGCC 

AAGAAGGCCCATGGCATCCTGGCTTGTATCAGAAATAGAGCAGCTAGTGG 

GAGCAGGAAGTGACTGTCACTCTGTACTGGCACACCTCAATGCTGCACCC 

AGTTCTGGGTCCCCTCTCACTACAAGAAAGACATTGAGGCCCAGTGAGGA 

TGGTGGGGGTTGGACTCAATGATCCCTGAGGTTTTTTCCAACCTTGATGA 

TTCTGTGATTCTCAGACCCCGTGGAAGAGGAGCTGTGGGATGGAGTGGTG 

CAGGGAGAACTCTACTTTGGGGACGATGATTATGATGAGGATGTGATGGA 

GGAGGATGTGGAGGAAGAGGAGGAGGAGGAGGATGAAGGGCAGAGCCCTC 

CGCCCGCTGTCCTGCCTGCCCGCCCTCGCCGCCTGCAGACCTTCACCTGC 

CCCCAGTGCCGCAAAACCTTTTTCCAGAGGAATTtCAGACCCAACCTCCA 

GTTGGCAAACATGGTGCAGATCATCCGGCAGCTC'CACCCGCACCCGCAGC 

GCCTCGCGCCGCCCGCCGGCCCCTCAGCCTCAGGCK3GTCCTGGGGGGAAC 

CCAGGGATCCTGGTGGCAACAGGAGGTCGGGGGTGTCCGAATCTGTGCGA 

GAA.GCACCAGG^.C.CCCTGAAGCTGTTCTGTGAGGTGGATGAGCAGGCGA 

TCTGCGTGGTGTGCAGGGAGTCACGGAGCCAGAAGCATCACAGTGTTGTG 

C C C C TGG AGG AAGTC GTGC AGG ATT AT AAGGTGG AGTTTGGGGAAGGGT C 

ACGGTGGGATAGTGGGTGAGGTGGGGTTTGGGGAAGGGCTGTGGTGGAGA 

AGGCGGGGTTTGAGGGAAGAGTTATGGGAGAGTGGAGGCTTGAAGGGAAA 

GTGAGGTTGGGATCAAGCTAGGTTCGTCTTGCTGAGCTGGTTGGGTTGGA 

GGCGTGGGAGGCTGGGAAACCACACAGTGCAATGAGGAGGTGGAAGGGTC 

TGGGTACCCATTTTCTGCTTAAAAACACCTTCCCAGCACAGTTCCTCAGA 

GAAAGCAAAAGGGAAGTGGCGTGAAAGTTGGCTCTGAGGTTCCGTTTTC A 

GCTCTGCCACCAAATTAGGGACAAAAAGAGGCGATGACAGAGGGGATTGC 

CCCAGGCAGGGTTTGCTGAGTTGTGTTTCCTTCCCTCAGTACAAACTCCA 

GAGCCATTTGGAGGCACTGAAGAAGAAGCTGGAeGCGGTGCTGAAGCAGA 

AGTCGAATGAGCAGGAGAAGATCACAGAGCTGAGGGTAAGAGCTGAAGGT 

TTCTGTGCTTCATAGAATCATAGAGGAGAACCATCAGGGTTGGAAGAGAC 

CACAAAGATCATCAGTTCCAACCATCACCGCTGCTGGGAGTGTGCCTTGG 

TGGCTGAGCAAGGAGAGAGAAGCTTTGCTGCTGCTCTGAGCTCTCACGGA 

GGCATCATaTTCCCTTTCCTGCAATTATTGGGCTGTGAGGGCTTGGAAAC 

GGTTTCCCAGTTGAATTAGAGCTTAATGAGAGCTTTGTGTGCGTCAGTGT 

TGAGTGGGAATTGGTGGTTTGGGAGCTGGTATTCCTCATTTGAGTTGAGG 

ATGCTCTACATCTCTAAACCTGTGCAGACTTTGCTCAGTTCTGTCTGTGG 

TGCATTCAGGAGATGCGTAAGCTTATGGTGTGTGGTGAAACTGAGAGAAG 

CATAGCACAGCAGCCCAAAAATGAGCTGATCTCTCACCTCCCCCTTCTGC 

AGCAATTCCCCTAATGCTTTTCCTCCCTCTGCAGGAAAAGATGAAGCTGG 

AAATCAAGGAATTTGAGTCTGATTTTGAGCTGCTCCACCAGTTCCTCATT 

GGGGAGCACGTGCTGCTGCTGCACCAGCTGGAGGAGCGCTACGAGAGCCT 

GCTGGCCCGGCAGAGCAGCAACATCAGCCAGCTGGAGGAGCAGAGTGCAG' 

CCCTTAGCCGCCTTATCACGGAGGCAGAAGATAAGAGCAAGCAGGACGGG 

CTACAGCTGCTCAAGGTCTTCTTCCATCCCTTTCCTTGTCTTTATGGGAA 

AGCGATAGCACGATGGTGGGAATAATGGTCCAGAAAGCTTCTGTGTCATG 

AGAGAGTGCCTTTAGTTGGTGGGCTGGGTGCTTCTCCACCCCTCCTTGTG 
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AAGATAAGCACTTGGTGAGATTTCCCTCATAAACACCCCAAAACGGCGGC 

CGTGGGGTGTGTTTCTGTATTAAAGAGCCCTCAGTGGAATGGTTTTTGCA 

GGGJTGTGGTCGAAGAGCAAAGCATCAA-aGGAAGGAGAGGGCAGTAATGT 

TGCAAAGGGCTGACGGCGGTGGTTGCAAAGAGGGAGGATGGGGGGGGATG 

CGCCAAGCAAAGGGTGGCGTGGGTTCACCCGCAGGGATGCACTGCGCCCT 

TGGCTCCGGGTTTTGGGACCGTACCTTGTACTCCTGGGCCGCCTGGTGGG 

CAGGGAGCACAGCGTGGGAGCGGTGCGCCTGGGACGCGTCGCACTGCGCG 

CAGATAGGCTCTTGGTCCTCTGTGCAGAAGAGCTTCAGAGCCTCG'CGGTG 

CTGCTTGCACCAACCCGAGGAATGCAAACTCAGCTGCCGGGCGATGCTGG 

CGATATTTGCCAGCTCTCTGCTGGGGCGGAAATTTTTGTGCAACGCCGTT 

TTCCTGCACTGCGGACAGGGGAAATTTCCCTCCAGCCCTTCCCAGCAGCG 

GGCGATGCACTCCCGGCAGAAGTTGTGGCCGCAGGGGATGGAGACGGGAT 

CCTGGAAGTAACCCAGGCAGATGGAGCAGGAGGCTTCGCTCTGCAGGCTG 

TCCAAGGGGCTCTGCGTGGCCATGGGCTTCCTGCTGGGGTCCGATCCGCA 

GAGGG AATAGGGGACCTTTCCTCCTTATCTCCTCGCTGATAGGAGAAATC 

CGGCCCCGGAGGCTGAGGCTGAGCCAAACAGGGCTGGGAGAGCTCAGCCC 

ATAGGGGATGCTGGTGGGAATGGGGGCAGCTCGCGGCTCCCCAGCACGGA 

GTCACCAAACTGGGGGGATCTGGCKjGAAATTCGGAGGAAAA^TCAGATTT 

TGTCCTGTCCTCGAGCAGCAAAGAGGGCAGGGGAGGCGATTTTTCCCTTC 

TGTGCGATCACTGTAAGGAATTTCCAAAGAAAACGCATGGAGGTCTGCTT 

GTTGGGATGGAATATAGACGTATATTGGAATAAATACAGGAAGACGTTGG 

AACATGGGAAGGCACTGAGATATAAGCGTGCTGTGTTGGATATGACTCTTj- 

CTCGACTAAAGTGAAGGTGGTTTTAATAGCACTGCTCAGAGCCAGGCGGG 

TTTTGGTGTTGTTTGGGGGGAATTACGTGGGTTTGGAATTGGGAAATATG 

AGACGGAAAAATAAGAATAATGGAAGCGCCCAACGTGGGGCTCGAACCCA 

CGACCCTGAGATTAAGAGTCTCATGCTCTACCGACTGAGCTAGCC GGGCT 

GATGGGCACGGACCCTTCTAAGCAATACTTCATGGTGATCCTGGGGAGGG 

GTGCTAATAATTCTACGTAATTATTTTGTTAATTATCCCGGTAATTATGG 

GTTCTGAGCAATCGCGAATCCACGGGGAAGAGCTGCATGGGGAAAAAGCA 

CCTATCCCTACGGGAATAGCCGGGAACTGCCCGGCAGTGCTGCAGGGGGG 

GGGAAAGAGGGGAAAAGCAGGAAAAAAATGGGCAAAATGGAACGTTTAAA 

AGTGGAGAAATTAACAGTGAAAAAAATGCAGGAAGCGTAAAAGTAAAGGC 

TGTGTTTCTGCCCGGTTTCGAACCGGGGACGTTTCGCGTGTGAGGCGAAC 

GTGATAAGCACTACACTACAGAAACGCGCTGAAGGCCGCTTCGGCGCACG 

GAGATGTGAAGGGGCGAATGCCGGGGCTCGGTGCGGAGTTTGCAGATAGG 

GGCCGCTCCGGGCCGCTCCCGCGCCGGTTCCGGTGAGCACAGAGTGCAGC 

gggtgacaaaatgaagggaaaaatgtaaaactgatgctcccgaatcgagg' 

CTCGAACCGCCArTGTCCGACTGACAGCCGCGCGCTCTACCGACTGAGCT 

ACCCGGAGACAGAGCAGCCGGAAGTCACGCCCCCGTAGAGCGCCCACCCC 

GTTGCCTAGTGAGAGGAGCGCCGCTTCCGGTCAAGTGATGAGCGGAGGGG 

GCGTGGCTTGTGTCAGATAGGACGGAAGTTCCGGTCAGGTGGTACTGGAA 

AGGGGGCGTGGCTTGCGGCAAAGGGGACGGAAAGCGGAAGTGCTGCCGTT 

GGTTGGCGGAGTTCGCACCATAGAAGAACGACGGCGGCGGTGGGAGGGCG 

GG AGGT AG AGC GGTCC C C GGGG AGAGTGCTG AC GGGAGC GGC GAGGCCCG 

AGGAGGGAGCGGAGCTTACGGGGGAGTGCGGAGCCTCGAGGCGGGTCCCA 

GCGCTTCGCTGTGGGGCAGGAGAAAGGCTTCGGGGCAGGAGGAAGAGGGC 

CTCCSGGCCWSSCSATGGAGGCGGTGGGCGACGATGGGGCGTCGTCGGGG 

CGGCTGAACCCGGTGGAGACGCTGCAGGAGGAGGCGATCTGCGCCATCTG 

CCTGGACTACTTCGTGGAGCCGGTGTCGATCGGCTGCGGGCACAACTTCT 

GCCGGGTGTGCATCGCGCAGCTGTGGGGTGGAGGAGAGGCTGAGGTGGAG 

GAGAGCGGCGGGGCCGCGGCGTTGGAGGAGGAAGAGGAAGAGCTGGAGGA 
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AACACGCAGGGCTCGAAGCTGAACCTCTCGGGGTTCTCGGGGAGGTCCTG 

TGGCACCAGTTGGCCCCGGGCTTGTTTTCGGTCTTCAGAGAGATGGAGGT 

TGGGGTGAGCGGTGGTGGGGTCCATGGTGACGTTGOCTGTGGGACATGAG 

GGGGAATGGAGGTAGGATTTAGGCTTGGGGGGAGCTGGAGAGGTTCCTCT 

TCCTTCTGTCCTTTTCTCTGGGTGCTTTTGGACATGGGCTGGTGGTGGTG 

GTGGGTTGATGGTTGGGCTGGGTGATCTTTGGGGTCTTTTCCAACCTTTG 

TGATTCTATGGGGTGTGTGGGGCTCCACCAGCCTCAGTGTCCCCCAGTAG 

AGATGTAGGAGAATGGGGAGAGGACAAATTTTAGGGCAGCATAATGCGGG 

AGGGACAAAGACATGGGAAGGGGACAGCTTGACATTCACGGAGGGGAAGG 

GG AAGC AC A AAC ACTGTT AGGTTTTGCCTTGAATCTGTT ACTGGCTTTGT 

AGGACCACCAGCATCAGGATGCTGTCCCCATTCCCTCCCTTCCCTGTGGG 

ACTGCGTTGTTTTTTCCCAAGAAAACCACTCCCCACCCGACATCCACCAC 

TGCTGACATACCTGGCTCTTGCAATTGAAACATCAGGCTGTCTGAAAAGG 

AGAACAAATTCACTGCATTGGGTTTATGCTTCAGGAAAAGGGGCTGGGAG 

ATGGGGAAGGGAAACCATGGGGGTCTGGGGGCTTCGCAGTGC.AAAAGCTC 

TGGGTTTACTGCAAGAGCCCCACGACCCTCCCAGACCTGGAGGAGACCCC 

GACCCCATTCAGTACCTTGGCACTTCTGCAGCGTCAGTCTCACCAGGACG 

TTCTTCTGAAGGAAGTCCTCCAACCTTCTTTCCAGAGTGGGGGAAATCTC 

tgctggagggctgaacttcatcatctcacagctgcaaagagaggagaagg 

gtggggatggggggactgttgcGttggttggttggctGttcattttattc 
tcaataggagaagctatggggtgaggatatttgcacagggacgaaatccc 

TTTCCCCCCTGGGATCCCTCTGCCTTGCAGC-CCTCCCCCAGGGTGCCATC 

CAAAAATCAGGGTGACAATAGGAAGGAGCCATGTTACCTATT'CAAGAGCC 

TCCTGATGTCCTAAAGGTGGGAGGAGAGAGGAGAGATGGATCAGAAGAGG 

AGCACCAAGGGGTGCCCCTTCGTATGGCAATGCACAGCAAAGACCACCCT 

GCCCACGGTGTGATCCCCCCCAGCAGCAACACAGGGAGCTGCCATGGGGT 

TGAGTTTGGGTTCTCAGGGTTTGCTCTGTCCCCCCATTTCCGACCACCCC- 

TTTGGGTTCTCACeAGCAGGAATTTGCTGTCGGGCTGCTGGAAtTTGCCC 

TCC ATCTC C C AG ATC AGGGTGTC AAGGTGGGAG ATCTCCTC C ATC AC CTT 

CGtCACCGCATCCTCCTGTACTTTGGTGACGGCTCTGTCCAGGTCTGCCA 

GCTGGAGCAGCAGGAAGCGCTCCTTCTCGTTCAGAAATCGCTGCAACTGC 

TCGAATTCACACACTATCCTCTTCCCTTCCTTCTTGGTTTTCTCCTGTTG 

GGATGAGGGAGAAAGCCAATGGGGtGGAAf AGAGGCAGGAAGACCCCCCC 

TGGGGTCTCAGGATGCCGTGTTCTGGGGGATATCCAACCAAAACCAATGG 

GGATGTAACACCAATGCCAATGGGAGCACAACACTAATGGCAATGGGAAT 

TTATCACCAGTGCCAATGGGAACGTAACAACAGCGCCAATGGGAACGTAA 

CACCAGTGCCAGTGGGAATTTATCACCAGTGCCAATGGGAACTTAACATC 

AAAAAGCCAAAGATCATCTTGCTGGG'CATTTGGGAGCAGCAGGAATTTTT 

C AGG AGTTTT ATC C C AAAAGC AAAACC AAAGG AGGGGGT AGG AG ATGAGC 

TCTGTATGAGGGATATTTACAGAGTTTAGGAGGATCTGCTACGTT ATCTC 

TTTAACACAGGGGTTCCTGCGTAACCCC'AGCTGATAAACACAGCCTTAGC 

GCTTTCCCAGCCCAGCTGCGAGCCAAAAATGCATGATCTGCCCCCAAAAT 

AC AC C AAAAC AAAC AGG AC AGGGCGG AGGGG AAGGC AG AC AC CTC C C CTG 

CTGCACCCACCAAATACAAGCCCGTCCTTCCACCAGTCCTTCTGCTTTCC 

AGGTACTTTTCCCTCTCCTCCTTTGAAGCCTGGAGGCGAGCCTGAATTTC 

TTC CTGTGC C AAAAG AAG AAAGGC GGAAAGCCTGTTTTCCC ACTT AAACT 

GCTTCTGTCAGATGGGAGAGGC'TTTGCTAAAGCCTGGAATCCTCTGCAAG 

GTGCAGAGCTGGGCAGAGGGAAGCTCTGTGAGCACGGTGTGCTGCTCTGG 

AGCTCTGTGCAAGCTGGGAGTATTTTGCAGAGAGAAAAGAGGGGAGAAGG 

GAAGGAAAAACACGAACTTGCTGCAAACGTAGAGAAAAACGCTGC AAAAG 

TGCAACAAAAAAATCAGCACTGACAGCTGCGCAAGGAGGTGTGGAAGGGC 
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CAAGAAGGGCTCTGTGTTTTCCTGCCTGGAATCTGAGCCCTCCCTACTGG 

GGCTCAGCTTTCCTTCTGATGCAGAAAGTGGAAAATAAAGAGCAGTGGGA 

CTGGAAATACCAGGGGGGACTCATGACTGGCATCCCCCACTGGAGGAGCT 

CAATGGTGAGCTGGAATCCTTGCTAAGTTTTATCGAATGTGGGGGACAGG 

AGGAAGAAATCAAACTCAAAAAGTCATGAACAGGTGGCTGTGAATTCGGG 

GCAGAAAGCTGAGGGCCCTAAAAGCACAGGAGGCAAAAAGGATGGAGAGA 

AACGACCCTA'CTGATGACACATCGCTGCCCAGCAGCTGACACCTACCAGA 

TCCTCCAGGTTTGGGCACTCCAGGGCGCTCTTCTTCCTCGGAGACTTTCT 

CTCTCCTCCTTTGGAAACCeCTGATATCCCTCTGAGTTTCTTCCCCAGTG 

AACCCACAGAACCTGTTGTTTTCAGCCCTTTGATGGGGTTGGGGTTTTCC 

CTTCCTGTTCCTTCCCAGTCTGGGGTAGAGCTATGGGATGGCTGCGTTGA 

GCCTGCAGGTCTGCTCCTGGTGGCACCCTTGGCAGGGCGTGCTGGGAGCT 

CTGGGTTTGTCCTTTGTCTTTCTCCCAGTTCCTTGTCCCGGGGAGATGCT 

GAACAATGTCACTTTGCAGATTTTGTCAGCTTCCTTTTAGGATCGAGCCA 

TCGGGAGTGGGGTTAGGGGGTGTATATGGGGAAACCATAAGGAAATAGGG 

AAGGAGATGCACAGCCGGATCCTTGTGGGGATGTGGAGGAGCACAAGTGA 

GGATCTTTGGGATTTGAGTGCTCTCTCAGCCCAGCACTAACACAGAGCAC 

TCACAGCCCTGGCTCTGAGCTCTCGAGGAAACATTTCCAACCATTTCTGC 

C CG ACTGTCCTTGTGTTG AGCCCC ATGGC C AAAT AC AC ATGC CT AGAAAA 

TAAAGCCATGCATTACATATGTATTTAATTTTTGCGTGGCAACCACTGAG 

ACCCAACTGGAGGAGATAACTGCCATTCACTTGGGCAGGTtTGCAGGGGT 

GAACTGCACTTCCAGCAAACCCTCCCTGTTGGGAAGAGCCACAGGGATGG" 

ATGGCACTCTGGGAGCTGAAGAACTGGAAGCAAACTCCCTGCAACCGCTC 

CCCTGGGGCACAGAGCCTTTCATCCCAAAATAAGGCGTCCATCATTGAGC 

AAATGAGTCACACCGTTGGGCAAACGACTTGCATTGCATCCCGAAAAGCA 

TTAATTGCAGAGCCTGGAAAACTAGCTGGGCTGGAAACATCTGCATTGCA 

GATCTACGGAGCAGAATAGACCCTGAACAGATCCTTCACCCAAATTCCCC 

AGCAGGTGGGACCAAATGGCAGCGATGCGTGGGGCTGAGGAAAGATACCA 

ACACATCAAAGAGCAATATTGAAATTTCAGCTGTAGGTTTGACCTTTGGA 

GGTGGTGAGGTGGGGCTTTGTCATGGGATACCCACTCATATCGCATCTGC 

TATTCTGAGCCTGATGTCGCCTGCTCCCTCCCACCCTCTTTTAGTTCCTC 

TTCTTGGTTCTACAATCACCAACCTGTGTGTATTTTGGTGCTGCCTGTTC 

CTCTTTTGGGCTTTCTCAGAAGAAAATGGGTTTTTGAGGGAATCCATTCA 

GGTGAGTCCTCACCCCAAGCAGCTCTTCTTCACTTTGTTGGCCCAAAGCT 

GACCCAGAGCCATACACCCAAAGCAAACCCAGAGCCGTACACCCATAATG 

AGGCAGGAAGTGGAGTGTGCAGAGCACATCTTTTAATTAAAATTAACTAT 

CAGAAACGTAGGCAGAGACCAGCTCCCCACACCAGGCGTTGCTATTTGCA 

GTGAAAGGCCGCATACCTTTGCAGGACACCCCAGATCTGCCCCACGATTG 

ATGTCAAATAGATGCATAAATTTCCTTCGAAGTCTTCAGTGCTCTCTGGT 

GGTTTCCCCACCCTGCAGAGGGACCGCCCCGGGGCTCCCAATGGGGACAG 

ACACAGGGCAGAGCAGCGGGTCCCCTTGGCACATTGCTCCAAGCAACCAC 

AGCACACATCCCATCAGATGCCCCTTTGATAAAGGACATCTCAAGGACAG 

ATCTTTAGGGGAGATCTAAACCCAACCCAATCCAAATGGGACATCAGCTG 

CCCACTCGTGGACTGCTCCTCTGAGGGGGGATTTTGGGTGATCTCTTGCA 

AGCGAGCCCCCAGCCCTATCTTGAACAAGGGGAGGACCTTCTCCCCATTG 

AACAAAGCCCTGGTGTACACCAAGATGGGGGTGTCATCATCCGAGCTGAA 

GAATGCCACCCGACCCCCTTCGTAGTCCAGGGAGACCCGAATCCTCCTGG 

GAAGTGCATTCAGACGTAGGTTGGGACGGGGAGACGTGAGGGAGTGGTAG 

GCCTCCAGCGCCCAGACACCCTCTTTGGGGCTGAAGCTCATGGGTCCCTT 

CCTCTTCATCGAAGCCCGGGCCACCCCCAGGGCCCACACCCCCCCCTGTC 

CCACCTCCACCTCCCAGAAATGCCTCCCCGAGGTGAAGCCCTGGCAGCCC 



ACAAAGATGAGCCCCCCTTCATCAGCATCAAAAAATGCCACCGT'CCCTCC 

AGCGTAGTCCAAGTGGACGCTGACCC rr CTGGGCACCCAGCGCAGAGCTA 

ACAGGGTCACCTTGTGGGTGGTGAGTGCCCGGACCTGTCCCCCGCATTTC 

TCCACCCCCCAAATCCCCCCTTTGGGACAGAGGCTGAGTTGACCCTTCCG 

AGGGATGGATTCTCGGGCCACACCGATGGCCCAGTCCCCTTCATCCCCCA 

CTTCCACCTCCCAGCAGTGCCGGCCGGCAGAGAAGCTTTGGTGGCCCAAA 

ACAAAGGGCCAGTAGGCGAATCTTTCGGGGTTATCAGGAAGGTCCTGTTG 

TCCTTCCCCACGTTTCACACTCTTTCGGTCTTCGGAGAGGATGAGGTCAG 

GGTGAGGGGTGTCGGGGTCCAGGGTGATGCTGGCTGTGGGGTGGAGAGGA 

TGAGGAGTGTAAGGTTTGGGTCCTCGGTGCTGAGGCCATGAGGATGCGGA 

GAGeTTGGATCTCCAGCACTAAAGGAGTTGGATGTGCTCTAGATGGCCCC 

ACCTGAGTAGGGTTGTAGGGTGGGACCGTGCCTTCCAACCTCAGCCATTC 

TGTGGGGCCATGGGTTGGCATCGGAAGGGTAAAAAGTACCAAAGAAGAAA 

GTAAAAAGGTGAGAGGTGGAAACCCCT.CTCATGTGCCCGTGCTATATGAC 

AAT AAAAGTGTTTTG AGC C C CC AG AATGC CC AG AAAT AAAGGC GTTTCT G 

■CAGACCTTCTGTTCCATTGGTCAAAAGAAATGGTGAGGGGAATAAAAATG 

GAAGGAAGGAGATCTATGGGATATTACCTGCAAAGTCTGCAGTGCTTCAT 

CTCCTAGACCAACCCGGACCAGTTCAGCCAACCCCATGGTTTAAAAAACA 

GAGCTGAAATCTGAAGGCAGGGATAATGAATGAGTTCAACCCGCTGACCA 

TATTTGTTTATGGGAAATGGATATTTATCAAGGCGAGGGATCTGCCCTGG 

GGCCATCATCCCAAATTACAGCCAGACTCGGCCTGCAGGGTGAAGAAAAG- 

TTGTTTGGCTGCGCTGATTTTTGTGTATTCCTCCCTCGGCATCTATTTTT 

GTCCATTTGGGTACAGCCTATGGGTGCAGGCGCGCCTCCATCTAACAGGT 

AATGCGGCTTTAGGTTCTCATGGTCAGCAAAAGGCACTTTTAGGAAAGGT 

GAAGCTGGAGGGGTGCAGAGCCGGAGAGCAGCCCGTCCTTCACCCGTGAG 

CACTTCTCAGGAATTACAGCAAAACGTGTAATTAAGAGTGGCAAACGGGG 

TATCGAGTCCTTCGGGTCTCAATTATTTTCCTGAGTGGGAATAACCCGTT 

GCTGTTCCATCTCTCTGCATTATTCTGCTGCAGAACGAGTGATGGGCTGC 

tggttttcaccaaaataccaccatttcccacccgaaacccttctgagtac 

cttgaagcctgttgagggtttccttcagagcaccgttcctccatgaggaa 

tggcacagcctctcctccggccctggagaagcgcccgctggcagctggaa 

ggtcacttttccacacctggaggggaaataaatgcattttcaggtggttg 

tatcacagagcatgccatcacttcaggacagcagaggccagcacacggcg 

gcc atc ccc aaaat acccttc agggctcgc agttg ccctggagc agaaga 

gcattcattgatgagctttctcctccatggtcactgcctgatgcaaagct 

cacagaacagcttttcagagaggccacatacctggtgatggggcttttca 

catcctggggacagaagagaggagggggagaggaaactcaggtcagtgca 

tgacccattttgtctttaaagtatggaaaattgagctgtttgagtggggg 

tggacctcttgggtcttccaacatgtgcccaattttgactttaagtcata 

gaaaaagtgaattgtttgactggggatggatctgttgggtctttcaacac 

atggtccattttgtctttaaatcatagaaataaagaattgtttgaccaga 

gatggacctctggggtcttcctccacgaggaaggtgaaccaactgaggag 

catccatgcacggcaatgaatcctgcagatccaccccactgctgctctcc 

caacccagccgtggatttcccctcttaaaacagaccccatgaggaccttc 

tgcagtaaggtgaaaatactgggaatactgagatgaggataaaacggtgg 

ggggaaagaggaggctgcaaacctccatctcctcattgtggtgggggttt 

caggctgatggaacggcataaaatgggaggaaaacacccaattaaggcac 

catgcaattggtcggggtggggaggacatccctaaaggacttttcccctt 

gaaaaagcttccctggaggaattcactcaccgactgctgggtcttctctc 

cctgtgctttcgtatccagcggggaaatctcctccgagtgcttggcggtg 

cttttctgcctcttctgaatctcatttttcaggtcttccagctgccagag 
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tcgatcaacgtttcaatgttggtatcaacaccaggtttaactttgaactt 

atcggcactgacggttaccttgttctgcgctggctcatcacgctggatac 

caacgctgatgttgtagatattggtca jcggctgaggtgtttcgattgcc 

gctgcgtggatagcaccatttgcgatagcggcgtccttgatgaatgacac 

tccattgcgaataagttcgaaggagacggtgtcacgaatgcgctggtcca 

gctcgtcgattgccttttgtgcagcagaggtatcaatctcaacgccaagc 

gtcatcgaagcgcaatattgctgctcaccaaaacgcgtattgaccaggtg 

ttcaacggcaaatttctgcccttctgatgtcagaaaggtaaagtgatttt 

ctttctggtattcagttgctgtgtgtctggtttcagcaaaaccaagctcg 

cgcaattcggctgtgccagatttagaaggcagatcaccagacagcaacgc 

gccacggaaaaacagcgcatacagaacatccgtcgccgcgccggacaacg 

tgataattttatgacccatgatttatttccttttagacgtgagcctgtcg 

cacagcaaagccgccgaaagttaacggtttgcccaggctcacaactgaaa 

gactttctacggtgtgcgcgtgcgatgcgcgtagaagactgatttatcaa. 

cctgtctttatatcaggattcattacctgactatttgtgggtaaagttcg. 

tagtgcgctgatcgtgcaaaatgattttagttgggaacagttcgcaactc 

tgteccataaaaatcagcatattcgcatctatcccatatccagcgcattg 

accatcgggatactgaagggagattccatcatctcttagaaagatcacca 

tctcttttgtttcaatttgcatatagctagctggaggatttatgaataca 

aggattttcatggactattaccatgagattgattttccatgtttattcgc 

gagagcagtggaaagcgatgacgatgtgggtactacattgcgcattcacc 

tactttgtgagcgcatggtcgaagcatggatatgcgcatgctgtgactgc". 

caagatcctctacgccggacgcatcgtggccggcatcaccggcgccacag 

gtgcggttgctggcgcctatatcgccgacatcaccgatggggaagatcgg 

gctcgccacttcgggctcatgagcgcttgtttcggcgtgggtatggtggc 

aggccccgtggccgggggac'tgttgggcgccatctccttgcatgcaccat 

tccttgcggcggcggtgctcaagggcctcaacctactactgggctgcttc 

ctaatgcaggagtcgcataagggcatcggtcgacgggatcacgttgtgtc 

cctgaagctctcctgtacccaaaCacaaaggtgatgtccccagcatccct 

atcccagcactctgggggactcct'attgaattcctccttgggcttgctgc 

cttctcttcccgttcccagagatcccaaaaggttaagcacchttgggtca 

gtgttcagaattgtcactgccagttttggggtatcagtggcaaattgaga 

cccttttacccaatcttgcaccactctggttccccagtcttatggtttta 

gatggagtaaaaaggtttatatgtcat.aaagttcttctgtgtctggttat 

tcgctgcttctggatgccaggatcatggg'gataaggggaaaacaatgggt 

tctcttatgcgtagagatggaatcagatggggagaaaaagaaatcttaat 

ctttctgatccatctgacagatattcagtacagccctgaggatgtgggga' 

aataaatctngragagttkgtkggcagttccaaggatttgggaatgacta 

aatcccattcctggkkwytgcacaaagttgsctgtgttggaacccagaaa 

gatccatgcaagtgggtcatccctgaaagcattgtgttctgctgtctgct 

agcggagagaaagacacagaggggaaaattaagtgttttattgttaatta 

t.tgtacactctgaggtttcaaataccaaatctttaacgagagcggaccac 

ttgatttgagggtgaccatctcagatggggacaactgtacctgatcaggc 

aaacctgggggaaatttgcctttctgccactcttttgggtgggattttcc 

cttttgaccaccattttctacattctaatcacccattgcagcacttctcc 

cccttttttttgccccatttttctcctgctcagcacttcttaacaatata 

atataaatcaatatcatatcaatatgattctatgccaatagattaatggg 

gatgaaagacacataaaaacccaagtcctcatttcatctgcttcccatgg 

gatgggtggggaggtggctgtcccctgaggctgtaggatgtggggtcacc 

cttgtctgtgtctcagggacacagcctcagcttggacctgacccctacca 

gccacagccacggacggaccctctccccagagaaggatgcatgggaaaaa 
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CGGTCAGCCCATTCGCCGCCAAGCTCTTCAGCAATATCACGGGTAGCCAA 
CGCTATGTCCTGATAGCGGTCCGrCACACCCAGCCGGCCACAGTCGATGA 
VTCCAGAAAAGCGGCCATTTTCC.vCCATGATATTCGGCAAGCAGGCATCG 
CCATGGGTCACGACGAGATCCTCGCCGTCGGGCATGCGCGCCTTGAGCCT 
GGCGAACAGTTCGGCTGGCGCGAGCCCCTGATGCTCTTCGTCCAGATCAT 
CCTGATCGACAAGACCGGCTTCCATCCGAGTACGTGCTCGCTCGATGCGA 
TGTTTCGCTTGGTGGTCGAATGGGCAGGTAGCCGGATCAAGCGTATGCAG 
CCGCCGCATTGCATCAGCCATGATGGATACTTTCTCGGCAGGAGCAAGGT 
GAGATGACAGGAGATCCTGCCCCGGCACTTCGCCCAATAGCAGCCAGTCC 
CTTCCCGCTTCAGTGACAACGTCGAGCACAGCTGeGCAAGGAACGCCCGT 
CGTGGCCAGCCACGATAGCCGCGCTGCCTCGTCCTGCAGTTCATTCAGGG 
C ACC GG AC AGGTCGGTCTTGAC AAAAAGAAC CGGGCGCCC CTGC GCTGAC 
AGCCGGAACACGGCGGCATCAGAGCAGCCGATTGTCTGTTGTGCCCAGTC 
ATAGCCGAATAGCCTCTCCACCCAAGCGGCCGGAGAACCTGCGTGCAATC 
CATCTTGTTCAATCATGCGAAACGATCCTCATCCTGTCTCTTGATCAGAT 
CTGCGGCACGCTGTTGACGCTGTTAAGCGGGTCGCTGCAGGGTCGCTCGG 
TATTCGAGGCCACACGCGTCACCTTAATATGCGAAGTGGACCTGGQACCG 
CGCCGCCCCGACTGCATCTGCGTGTTCGAATTCGCCAATGACAAGACGCT 
GGGCGGGGTTTGTGTCATCATAGAACTAAAGACATGCAAATATATTTCTT 
CCGGGGACACCGCCAGCAAACGCGAGCAACGGGCCACGGGGATGAAGCAG 
CTGCGCCACTCCCTGAAGCTCCTGCAGTCCCTCGCGCGTCCGGGTGACAA 
GATAGTGTACCTGTGCCCCGTCCTGGTGTTTGTCGCCCAACGGACGGTCC 
GCGTCAGCCGCGTGACCCGGCTCGTCCCGCAGAAGGTCTCCGGTAATATC 
ACCGCAGTCGTGCGGATGCTCCAGAGCCTGTCCACGTATACGGTCCCGAT 
TGAGCCTAGGACCCAGCGAGGGCGTCGGCGCCGCGGCGGCGGCGCCCGGG 
GGTCTGCGAGCAGACCGAAAAGGTCACACTCTGGGGCGCGCGACCCGGCC 
GAGTCAGCGGCCCGCCAGTTACCACCCGCCGACCAAACCCCCGCCTCCAC 
GGAGGGCGGGGGGGTGGTTAAGAGGATCGGGGCGCTCTTCTGCGTGCCCG 
T GGC C AC C AAG ACC AAAC C C C G AGCCGC CT C C G AAT G AGAGT GTTT GGTT 
CCTTCCCCCTCCCCCCGCGTGAGACAAACCCTAACCACCGCTTAAGCGGC 
CCCCGCG^GGTCCGAAGAGTCATTTGGATCGATCCGGAATTCTCATGTTT 
GACAGCTTATCATCGATAAGCTTTAATGCGGTAGTTTATCACAGTTAAAT 
TGCTAACGCAGTCAGGCACCGTGTATGAAATCTAACAATGCGCTCATCGT 
CATCCTCGGCACCGTCAGCCTGGATGCTGTAGGCATAGGCTTGGTTATGC 
CGGTACTGCGGGGCCTCTTGCGGGATATCGTCCATTCCGACAGCATCGCC 
AGTCACTATGGCGTGCTGCTAGCGCTATATGCGTTGATGCAATTTCTATG 
CGCACCCGTTCTCGGAGCACTGTCCGACCGCTTTGGGCGCCGCCCAGTCC 
TGCTCGCTTCGCTACTTGGAGCCACTATCGACTACGCGATCATGGCGACC 
ACACCCGTCCTGTGGATCTGCCTCGTTGGCCTGCCGCAGTTCTTCAACCT 
CCCGGCGCAGCTTTTCGTTCTCAATTTCAGCATCCCTTTCGGCATACCAT 
TTTATGACGGCGGCAGAGTCATAAAGGACCTCATTACCCTTGCCACCGCC 
TCGCAGAACGGGCATTCCCTGTTCCTGCCAGTTCTGAATGGTACGGATAC 
TCGCACCGAAAATGTCAGCCAGCTGCTTTTTGTTGACTTCCATTGTTCAT 
TCCACGGACAAAAACAGAGAAAGGAAACGACAGAGGCCAAAAAGCTCGCT 
TTCAGCACCTGTCGTTTCCTTTCTTTTCAGAGGGTATTTTAAATAAAAAC 
ATT.AAGTTATGACGAAGAAGAACGGAAACGCCTTAAACCGGAAAATTTTC 

ataaatagcgaaaacccgcgaggtcgccgccccgtaacaaggcggatcgc 

cggaaaggacccgcaaatgataataattatcaattgcatactatcgacgg 

cactgctgccagataacaccaccggggaaacattccatcatgatggccgt 

gcggacataggaagccagttcatccatcgctttcttgtctgctgccattt 

gctttgtgacatccagcgccgcacattcagcagcgtttttcagcgcgttt 
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F igure 6 

DM 

G C AC A AG G AA ATGCAAAGGG G CATC AC "AG GGGACATGGC ACGGGGCATT 

51 CTAGGGAGCA TTGCATGGGG AC ATT GC AAA GGAAATGCAA AGGGACATTG 

101 CATGGGGACA TTGCAAACAA ATTGAGTGGG AGATTGCACC GGGATGTTGC 

151 ATGGGGACAT TGCATGGAAT GTCCCACCAA CCACCCTGCA GGGTGACACT 

2 01 GGGACCATCC CCAGCTCTGA CCATCCCCCC TTTGCTGCAG CACCACCCCA 

2 51 GGTCCGCATC GTCCCCATCC CCATCTCCAA CGACCCCGAC ACCGTCCACC 

301 TCATCTGCCA TGTTTGGGGC TTCTACCCAC CCGCAGTGAC CATCCAGTGG 

351 CTGCACAACG GCCTCGTGGT GGCCTCAGGT GACACCAAAC TGCTGCCCAA 

4 01 CGGGGGACTG GACCTACAGG ACACAGGTGG CCCTGAGGGC CAGCATTGCA 

451 GCAGGGAGCA CTAAAACATG TTCAGTGTGG CAATTCCAGC TTGGAGCAGC 

501 CGCTGCAGGA GGATTGGAGT GAGTTTGGGG AT GG GGATGT GGCACCCACA 

5b 1 CCCCACAGTC CCCCACGGTT CATTGTGCCC CACGCTCTCC CCACAGGTCC 

601 CAATTTGTCC CCGGCGATGA TGGTGAAGGT GGCAGTGGCG GCCATGGCGC 

651 TGACGTTGGG GTTGGTGGCA CTCAGCGCCG GGGTTTTCAG CTTCTGTCAG 

701 CGGCCACGGG GTGAGGGATG GGGATGTGGT GCTGGGGACA TGTGTGACAC 

751 -CGAGGGTCTG GTGTCCAGTG TGGGGTGTAC CTCCTCATTC ATCATCTTCT 

801 GTGTGGCAGC TCCTGGCGCT GGTCCCAGTA ..CCCCGTCCTG ATGCGGGTTC 

8 51 TCACTCCAAT CCTGGTCCCC AAAATGATCC CGGTCCGAGT TCTGGTCCCC 

901 ATCCCAGTCC TGGACCCCAT CGCAGTCCTG GTCCCCATTC TGGTCTTGGT 

951 CCTGGTCCTG GTTCTGCTCC TGGTCCCTAT CCCTGACTCT GGTCCCGGTC 

1001 GCCATCCCGA TGCCAGTCCC AGTCCTGGTC CCCAf CCTG'G TCCTGCTCCT 

1051 TGGTTTGGGG ACCTCAATGA CTGGAACTCC CATGTCCCAA CATGGGGACC 

1101 CACAGTTTGG GGTGAGGGGC TCTCACCCCC CAAT AAAAC C ATCTGCAGCC 

1151 CCAACCTCGC TCCAATTCTT CGTTCCCACG TTGGGTGGGT CGGGCTCCCA 

12 01 GTGCTCCCAG CCGTNTATGT. CC'CGTAAGCG TCGGCTCCAC TGCATAAAAA 

12 51 GAAAAAAAAA AAA 
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Sequence Genomiq-ue T AP1 
{DU debut de V exon 2 a 1'extTemite 3') 



T - - - ctg ccc tag tag „g Gf c cgc _ ^ 

GCC ATC CTG CCC ATG GTG CTG r r T ^ ag GXACTGGCATAGCGGGGACGCGGTGCGCGCAGCGCGCAGCGCG 
^CCCCCTGACACCCCACTCCCGTCACAG C GCT GTT ACT GAG cf ^ ^ „ _ _ _ _ _ 

™ ™ " c A " T f T T T ? T Tt T C S C T T tV™ " 

T T T V. T °f = CT ^ GC "-------c A cc GGGATMGGGACAGGG L GC s acTG r ACG ^ J s 

TCACCCGGCAG « y _ «= ATG CGG y ACG CGG GAT GCG GAG ? CTG CGC „ GGG CT , _ _ 

? ? f r T T T T T T T - T T CTC m - - 1 L L 1 1 

" lj F A T M A ' W L S 

= CG CGC »T6 CCC ? CJC ACC GCC CJO GCG CTG CCA CTG CTG CTG CCA CTG CCC AGG OT GTG GGG CAC 

-CGC CAG GTATGGGCTGCTGTCTGCACCTCCATGTGCCTTTGGTCCCCTCCATGTGCCTCTGGTCCCCl'CCATGTGCCCAGTGTC 

T g.cc_ T ccac. T gcccca T gcgc CTT cca,gcg T cccacga T cc= T gcga TGTGCT ca™ TT cc= T a T g T g T gAcga™ccc TT cca 
■ ---™ac TCT cccc T ccccagc=c=ga TT cg CT ,cccagcccgcc T gcWgacac T gc T g T ccgcag gcc ctg gca 

CCA GAG ATG CAG AAG GCG GAG GCC CGG err nrr* n*r* 
P Q M Q * A q A r ^ 3 ^ ^ G GCA G '^ G G AG ACC TTC CAG GCC ATG GCC ACT 

~ A ■ V . E T F q A M A T 

^ CGG AGC TXT GCC „ T G f GAT GGG CCA GCT GCA CAG TAC CGG CAC CGC GTG GAG CAG AGC CAC CGC 

Q R L Q q s H R 

CTG GAG AAA AAG GAT GTG GCC CTC -z\r apt m 

L 2 K K D V A T S T T ACC AGT GGT GTATGGGATGGGGTGGCTCAAT 

° ^ w T S G 

AGCATGGGGACGTGATGGGATGGGGCTGGGGGATGTGGGGACATGATAGGATAGGACTGGGGGGCA.TGGGGACATGGTGGGATAGGGCTGG 
~ GMfflCCT ~----«----=AAT .CCAACGGGCTGGAGGCCATAATGGTGTGGAGATGGCAGGT 
CATGGGAATATGATGGCATGGGGACTGTGGGACATAGATTTGATGGCATGGGGACATCAGGATGTAGCAGGCACAACAGTTCAGGGGCTCT 

-GTCCCCTGGTCACCTCATGGCATCCTCAC TTC TCA GCC CTC GCC CTG AAG ATG GGG ATC CTC TAG TAT GGG 

^ K M G I Xj Y Y G 
GGG CAG CTG GTG GCC GCG GGG ACC GTC JXrr m " " 

G Q ?V V A A G T A f A T CT GGG G ^ C C ^ C GTC ACC TTC CTC CTC TAC CAG ATA CAG 

V T F l L Y O 4 T . n 
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ttc act gat arc era gag ^saccct^^^c^tccccatctccccat.tctccc^ccacaotc^t.,.^ 

CAGTG TCCCTGTGTT' --TACATCCTCCCTGCTGTGTCTCCAGGCCA* fCC -AGTGTGTCCCCATGCCCATCCATGTCCCTGTGTCCCCACG 

TCTAACCCTCTGTGACCCCTGCCACATCCCTGTGTCACCTCCTCTGTCCCCATACCTACCCCGTCCTGTCCCTATGCCAATCCCACTGTGT 
CCTCTGCGTCCCCATGTCACCATGCCACATGCCCCTTGCCCTCCTGGCCACGTCACTACGCTGTCCCCAG GTC ■ CTG CTC GAC TAC 

TTC CCC ACA CTG ATG AAG GCT GTG CGC TCT TCG GAA AAA ATC TTT GAG TTC CTG GAG CGG GAG CCA « 

GTC TCA CCC TCA GGC ACA ATG CCA CCC GCT GAC CTG GAG GGC CAC CTC CAG CTG GAG GAT GTC T^C TTC 

LQGhL QLE DVWF 
TCC TAC CCT GCG CCC CAC GAA ACC CGT CCT CAA GTGGGCACAGAGACACAGCCAGGGGACACGGGGGTGTGGTGGGACA 

GCGTGACAGGTGTGGAGCACAGTGGGGTGATTCAGGGACATGGATGTGATGGACAGGGTGTGAGGATATG. : \AACAAGGAGATACATGGAGG 

GGGTGGTATGGGGACACTGGAGAGGGACATGAGATCATGGTATTGAGGGCGCGGGGACATGGCACATGGTGGGTTTGTGGCACTGGGACAT 
GATGAGTGACACAGAGACATGGTGGGGAGGGCATGGGAATGTAGAGGCCGTGGTA 

GGG GTA TCA CTG GAG CTG CGC CCC GGG GAG GTG CTG GCA C-C C'r G r-A r~- rr- ^ 
G V 3 L 3 L R P G E V r CG ° GC GC - A GGG ^ AGC 

rt L L G p P G A G K 

ACT CTG GTG GCC CTC GTG TCC CGC CTC CAC CAG CCC ACG GCC GGG CGC CTG CTG CTG GAT GGC CAC CC^C 

1 ~ G R L L L D G H P 



CTC CCC GCC TAG CAG CAC TCC TAC CTG TCC CGC CAG GTGAGCAGCCACATGTCCCCATGGCTCC.TGGTTGTCCCCCTG 

TGTTCTTGCATATCAGCAGCCATCCTCATTGAGTCACCAGATATCTGGGTCCCCAGCCATCACCACACACCCTGATGTCTCTGCCATATCA 
CCACTCTGTCCCCTGCACTGTCCCGGCCAAGTCCCC^CCATCCTTCTGTCCCCAACCATCCCACCATGTCCCCAGATGTCCCTGACACAT 
CCCCAGCCATCCCIACCGCCTCCACTGCCACGTTGCCCATGTTCCCCAGCTGTCCCCCCCACTGCAG GTG GCC GTC GTC CCC CAG 

CAG CCG CTG CTT TTT GCC CGC TCA CTC CAC GCC AAC ATT TCC TAT GGG TTG GGG GGC TGC AGC L GCA 

rt N i 5 y q l G G C 5 R A 

CAG GTG ACA GCG GCC GCC CGC GGG GTG GGC GCC CAC GAC TTC ATC ACT CGC CTG CCC CAA GGC TAC CAC 

H D F I T R L P Q G y 



ACA G GTAAGCTGTCCCCTTTCTGTTCCGGGTCCCCTCCATGGTCCCTCCCAGCCTGACCCCGCTCGTCCCCGCAG AG GTG GGC 
GAG TTC GGA GGA CAG CTC TCC GGG GGG CAG CGG CAG GCG GTG GCC ATT GCC CGT GCA CTG CTG CGG L 

GQr< 3 a vaiara llrd 

CCC CGC ATC CTC ATA CTC GAC GAG CAC ACC AGC GCC CTG GAC AAT GAG AGC CAG CAG CAG GTGGGATGTC 

A L . D N E S Q Q Q 

CCCCACGTCCCCGTGTCCCCACATCCCCCTGAGCCCTGTGTTCCCTCAGATTGCACGCCTAGGTCCCCATGGTCCCCTGTTCTGGTGTCCC 

V E Q 

GAG ATC CTC GCA GCC AAA GGG TCG GGG CGT GCA GTG CTG atp r T r Arr ^ . 
E I L A A K G S ^ p a G GGG CGG GCA GCC CTG GCG GCG 
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CGG GCA CAA CGA GTG GTG GTG TTr; <~r<~ 

* A Q R V V V T T T °f G J G CG r G C J G G f <** CCC CCC CAC GAG GTG GTG 

Q E G P p q £ V v 

CGC CCC GTC AGC CTT NTT GCG GGA err rrr » - 

« P V S L ■ , T G T G f T T A f G f °f C f GGG AGG GGG ACA GAG GGA TAG 
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Figure 8 

TAP2G ~ 



-213 



T« CTG CTG A ^ C Tc\T T ^^ ATG GCA ACG CCG TI 

W L V l T H 

ri -MA T P < 

=CA £ ^cY^C^V^r TO «= ™= CTC CTG GTC CCC ACT GTG GGG ACT GGG ^ 

A K E * K A « V A L L T « S L L V p T v A T ■ 

TTC CTC 5 TT C G c r ?G C G C G C A C ??G A GC G T CG . G 2 S G ™ « •« ™ CCC GAG TGG CCG TTC CTT GGC TG T GCC 

F ^ F L r L L * L A W P rr w P 

.v o ^ W ? .r L G C A 

GGG Sc 55 G GC C Sc C gIg G c1L™ -= 3 ^ CCC TAG TGC ACC GGG AGG GCT GTG GAT CTC CTC CGC CAG 

° G L A *- ' C T G R A v o V L R Q 



GTAGGG^CCCA^StS^c^^^ AGC AG 

M C L A 3 A S s 

- ™ SfS^T ^ TCCTTCCCAG C TCG CTG m CCC GGC TGC CCC GOT GGC CT 

F "-' ■ 1 R ? 3 L F A G C r. G G L 

TTC TTC 5 CAG C Sc T ACC G Ic C A T GCA CG : 7 j5 CC ^ ^ CAG ° TC TTC ^ AGC CTG GTG TAC CGG GAC CTC GCC 
P F Q N T T A " ' R " Q L F S S i. V y a „ fc fl 

TTG G^rTCC^CGT C ?G GAC rAC G C G ^^ 

^ A S R 7 T- nn 

A E 

«C CAG 9 G T G G ?T T C G G T G G G A C C T G C C T T GC GCG 9 S GC ^ «* <=TC AAT ATC AAC GTC ATG CTG AGG AAC CTG 

G « " ° = I c A S " V - * I. N ; I n v ■ h L R N L 

GCC JTC°AGC G pA T C=G S ^ C Sc GGG 9 C r "? «* ~ CTC ACA ATG CTG GCA CTC CTC GAA GTG CCG CTC 
A V T * R K V G " 3 P R L T M L A . L j, E v p L 
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+ 9 91 TAT GAC ACC CGG CAC CAG 
GTGATAGCAGGGATGGGATGGTAGGGTTGGGGTGACAGGGATGGAGGCAATGGCAATGGGATGGGAACAGTGGGAGTGGGGAT +1091 



+ 1092 



ca?Sg G ?c T cS 

c G ccd A L^ 

ML 

TCC GA G C Jt G G C GT G A G CG C G G GT G C CT + G 1^ ^ ^ ^ ^ ^ G ° A ° CG GCA GTG <™ <™ TCC ATC TCT 

S I E ? v R R J ■ ' D A A A D T ^ A A V Q E S I s 

CTG ccf GAC T cL^GG G GAC G JcA GAG l G 5 G ^ ^ ^ ^ TAC ^ CAG GTG CTG C ^ AGG ACC OTA CGG 
L R D Q R D T " E E " " R Y 3 Q V L D R T L P. 

+ 14 65 GAG AGG GCC ATT TTT CTC CTC ATC CAG CGG 

GTGAGGCTGACACGAGGGGACACCCTGGTGTTCTGGGTGGGATCGGGACATCCCCGCTGAGCCCC^ + l561 
11 A i F L L I Q r 

CGC G^g'ac^S? S? + CA I 4 ! TG CAG GCA CTG GTG CTATAC.TGT GGG CAC CAG CAG CTC 

R E G D L T V ' Q L A V Q A L V L Y C- G H Q Q L 



GT^C^SgtS^ CAG ACT ^ GCT GGC AGC ™ CAG 

A G S ■ L V A F I L Y Q T K A G S C V Q 

C^CA^ 



+ 1335 GCG TAC TCC TAT GGT GAC CTT CTG AGC AAT rrA r-vr r-r-r- ^r- , „ 

CTG GAC TGG GAG CGA CCT GTG +1915 GTG GCC GCC TGC AAG GTC TTT GAT TAC 

L D W E R p J G ° 1 L S N A V A.AC K V F D Y 

TCC TTc1cC G ?I T G cL G St G Sc ACC 19 A 6 ^ AGA CTG CGG GGC CAC ATC ACC TTC CAT CGG GTG 

G A G G T Y V P T R t p "r- - - 

S F A Y ? T R \ n 1 T . F H R V 

TTG GCG ' G^G^CTG^AT ""gGC^AGC^+Z 077 ^ GAT GTC ACC TTC GAG CTG CGC CCC ACT GAG GTG ACG GCG 
LAGlNGi VLQDV? G L ?. P 3 £ V T A' 

CTG SrLc G G G G G G^T G G A CCG\ C TG TGC 2 G 5 G ^ GAG AGA TTC TAT GAA CCT GGG GCC GGG GAA GTG 

L L D G V P ■ L C V A L L E R F Y G P G A G E V 
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+ 9 CGG GAC TAC GAG CAT CGC TAC CTG CAC CGC CAr 

gtganggggtggg^ggaaatgttagctgcactgaacwgctggggctgL +2254 

ATT GcfTAC G S A ATG G ' r G G AfSAC TG ^35^ ^ CCC GTG CTC ™ TCT GGC TCC ATT CGG GAT AAC 

A Y G M E V D A " V G ° E P V 1 F S G s I R D N 

GCA crl 3 g\ G T CAA G G^C G ? T G T G GGC GAG 2U6 ^ A GCA GCT GCG GGT GCT ™ SGC TTC ATC TCT 

A L E q ' F c E 1 1 A A A R A A G A L G r I S 



^gag^ga ggg T g GA g GT Sg TGGGGA s^ . AC 



+2' 

GTA GGG GAG AGA GGG GGG CAG " 
T 

G £ R G G Q D 



ATC S ATC^C T ^ G ^ G Sc^2^ ^ CGC ^ ^ GCC ° GC GC? TTC GTG GGG CGT CCC ACC 

I L I L D E A ^ K < 2 R I A I A R A L V R r p T 

+ 2 5 93 ACC ACT GCT CTG GAT GGG GAC \gC GAT GCA A-r 

ctgagcactgagcagtgggtggggggagggtctgpccctgcagt'gcat^ctSa?^ + , 68e 

■ . ■ A L D G D S DAM 

CAc '.^ 8 CCA T SG T SrCTG ^ 2^ ^ ^ ^ ^ GGA GGG GAC CGG * GG GTG TTG TTT ATC ACC 

H Q P R M L L Q ° W V R N G G D R T V L F r T 

GCC GAG ^ CT G G AGG A AC C G 'cGC ^ GC C G + 2 8^5 0 ^ ^ ™ ^ ^ GTG: GCT GAG ATG GGG ACA CCC 



A E L R -T ■ R G L E " G T V A M G 



-2 851 GGA CCC TAC AGC CGG CTG TTA CAG «C TGA 
GAACCATGGAGCAGCTGGAGTGGCATGCGATGGGATATGGGGAGCAGTCACTGCCTTTGCTTCCAGC .2947 



L L Q 

AGGATGGGATGTTTTGW 

+ 2999 3 *'UT 



+ 2943 TGCAGGATGGGATGTTTTGGGATTTGTGTGGAAT^GTGGAGATGCTTTGT 



INT PON 2 -3 : EF2 3 ( I t>l R) 3 R 

INTFON 3-4 : ^23 ? (1) 

INTFON 4-5 : £P2 3 352H CON 

INTFON 5-5 : HT2 322'4 RS 

INTFON 6-7 : EF2 3?5 3f-5 RB) 1 R 

INT RON 8-9 : EF23277 B CON 

INT PON 9-10: 3F23 4 3 RSR 
INTFON 10-11: W23 43 RSR 

INT RONS 1-2 ET 7-8 INEXI ST ANTS CHEZ LE. POUET 



31/31 



2771422 



CTQ 
C 
»t 
fD 




REPUBLIQUE FRANQAISE 



2771422 



INSTITUT NATIONAL 
de la 

PROPRIETE INDUSTRIELLE 



RAPPORT DE RECHERCHE 

PREL1MINAIRE 

etabli sur la base des aern feres revendicatiorm 
deposees avant le commencement de la recherche 



N° d'enregistremen! 
nat(ona) 



FA 550336 
FR 9714669 



DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie 



Citation du document aveo indication, en oaa do besoin, 
dea parties pertinentes 



GUILLEMOT F. ETAL.,: "Physical linkage 
of a guanine nucleoti de-binding 
protein-related gene to the chicken major 
histocompatibility complex" 
PROC. NATL. ACAD. SCI. USA, 
vol. 86, - juin 1989 pages 4594-4598 
XPOO20744O4 

le document en entier, esp. discussion 

GUILLEMOT F. ETAL.,: "A molecular map 
of the chicken major histocompatibility 
complex: the class II beta genes are 
closely linked to the class I genes and 
the nucleolar organizer" 
THE EMBO JOURNAL, 

vol. 7, no. 9, - 1988 pages 2775-2785, 
XPOO2O74405 

e document en entier, esp. figure 1 et 
page 2783, 2. colonne 

MILLER M. M. ET AL.,: "Regions of 
lomology shared by Rftp-Y and major 
histocompatibility B complex genes" 
'MMUNOGENETICS, 

vol. 39, - 1994 pages 71-73, XP0020744G6 

* le document en entier * 

WAKENELL P. S. ET AL. , : "Association 
between the Rfp-Y haplotype and the 
incidence of Marek's disease in chicken" 
I MMUNOGENETICS, 

vol. 44, - 1996 pages 242-245 
XP002074407 

* le document en entier * 



-/■ 



Revondcations 
concern6t?8 
do la demande 
oxaminee 



1-10 



1-10 



DOMAIN6S TECHNIQUES 
RECHE RCHES (lnt.CL.6) 



C12Q 



Date d'achevement de la recherche 

13 aout 1998 



Muller, F 



CATEGORIE DES DOCUMENTS CITES 

X : particulierement pertinent a lui seul 

Y : particulierement pertinent en combinaiaan avec un 

autre document de la meme categoric 
A : pertinent a I'encontre cfau mains une revendication 

ou arrie re-plan technologique general 
O : divulgation non-ecrite 
P : document intercalate 



T : theorie ou principe a la base de I'invention 

E : document de brevet beneficiant d/une date ant^rieure 

a la date de depdfc et qui n'a ete pubfie qu'a cette date 

de dep6t ou qu'a une date posterieure. 
D : cite dans la demande 
L : cite pour d'autres raisons 

& : membre de la meme farnille, document corresponds nt 



REPUBLIQUE FRAN?AISE 



2771422 



INSTITUT NATIONAL 
PROPRIETE INDUSTRIELLE 



RAPPORT DE RECHERCHE 

PRELIMINAIRE 

etabli sur la base de*» dernieres revendications 
depoaees avant le commencement de la recherche 



N* d'enreglstrement 
national 



FA 550336 
FR 9714669 



DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie 



Citation du document aveo indication, an cas dl besoin, 
des parties pertinentes 



ttevend cat ions 
eoncern6e« 
de la demande 
examinee 



A 



Z00R0B R. ET AL. , : "Chicken major 
histocompatibility complex class II 
genes; analysis of interallelic and 
interlocus sequence variance" 
EUR. J. IMMUNOL,, 

vol. 23, - 1993 pages 1139-1145, 
XP002074408 

* le document en entier * 



VALLEJO 
between 
complex- 
Marek's 
6.3x7.2 



R.L. 
Rfp- 

l.ike 



ET AL.,: "Non-association 
Y major histocompatibility 
genes and susceptibility to 
disease virus induced tumours in 
intercross chickens" 
ANIMAL GENETICS, 
vol . 28, - 5 octobre 
XP0O2074409 

* le document en entier 



1997 pages 331-337, 



KAUFMAN J. ET AL.,: "Different features 
of the MHC class I heterodimer have 
evolved at different rates" 
J. IMMUNOLOGY, 

vol. 148, - 1 mars 1992 pages 1532-1546, 
XP0O2074410 

* le document en entier * 



DOMAINES TECHNIQUES 
RECHERCHES {lnt.CL.6) 



Dale d'achdvement de fa recherche 

13 aout 1998 



CATEGORIE DES DOCUMENTS CITES 

X : particulars men t pertinent 4 lui seul 

Y : particulierement pertinent en combinaiaon avec tin 

autre document de la meme categorie 
A ; pertinent a fencontre d'au moino une revendication 

ou arrtere-plan technoiogique general 
O : divulgation non-ecrite 
P : document intercalate 



Muller, F 



T : theorie au prjncipe a la base de ('invention 

E : document de brevet beneficiant d'une date anterieure 

A la date de depot et qui n'a ete publie qu'a oette date 

de depot ou qu'a une date posterieure. 
D : cite dans la demande 
L : cite pour d'autres ratsons 

& : membro de la meme famille, document correspondant 



